訂閱電子報

智慧生活報

訂閱文章

Plurk

使用者登入

[技術論壇] 擴增實境的原理與應用

Posy by Marduk

Augmented Reality (擴增實境)的定義

廣義上來講,所謂的AR〈augmented reality,有人翻譯成「擴增實境」〉是將電腦的資訊疊合到現實世界,讓我們在正確的時間正確的地點取得〈感官的〉正確資訊,而VR〈Virtual reality虛擬實境〉企圖取代真實世界,以往通常就是在電腦裡面製作產生一個虛擬的環境,將資訊放置在裡面,而操作者可以藉由控制器或鍵盤在這個虛擬的環境下穿梭或互動,相對之下AR則是在現實中擴增資訊。

AR的發展歷史

1960年代,電腦繪圖先鋒蘇澤蘭(Ivan Sutherland)和他在哈佛大學與猶他大學的學生,就已開發出第一套AR系統。70與80年代,美國空軍阿姆斯壯實驗室、航太總署艾密斯研究中心,以及北卡羅來納大學教堂山分校等機構,也陸續從事AR的研究。直到1990年代初,波音公司為協助工人裝配管線設備,開發了實驗性AR系統,才創造了「擴增實境」這個名詞。隨著硬體成本下跌,一些必要的實驗室設備不再那麼昂貴,AR的研究逐漸成熟,1998年起,科學家更是每年召開AR大會。

AR vs VR

虛擬實境發展表較成熟,但是限制也越來越明顯。首先,可以讓人感動的虛擬實境,大多需要特定的環境跟設備,才有辦法真正重建一個環境,並且提供堪稱豐富的互動跟內容。要做一個虛擬實境不難,但是要做一個逼真、吸引人,或是可以達成特定目的(如飛行訓練等)的虛擬實境,困難度非常高。

虛擬實境的另一個問題是,虛擬跟真實差距太大,沒有辦法跟日常生活相連結,所以我們使用虛擬實境的時候,大多有其特定目的存在,一旦目的達成就不會再使用了。例如飛行訓練,只有在飛行員接受訓練時才會使用;或例如透過3D虛擬實境看屋,等到現場看過實際屋況,就不會再使用虛擬實境了。而且虛擬跟真實之間總是具有一定程度的落差,無論飛機駕駛,或是傢俱尺寸、天花板高度的丈量等,都必須實際操作最為精準,虛擬並無法完全取代實境。

顧慮到虛擬實境較不「實用」的特性,於是AR另闢蹊徑,AR並不企圖切斷人跟真實世界的關聯性,營造另一個虛擬世界;相反地,AR利用「加法」,在真實世界裡,透過互動應用技術額外加上一些資訊,讓我們在生活中,處處都有新的互動體驗。這個加法,不但省掉了重新架構新世界的困難,並且在既有環境中融入各種資訊,還可以解決日常生活當中的大小問題。

試著想像,修理技工在檢查設備的故障部位時,可以透過AR看見一些重點式的說明,指出哪些零件需要檢查;又或者,外科醫生只要檢視即時的內臟超音波掃描,就能看到等同於X光照出來的影像顯示在病人身體上;消防隊員可以看見失火建築物的內部格局,避開被遮蔽的危險地帶;兩兵對戰時,可以看見敵方狙擊手的位置;觀光客沿著街道掃視,就能看見每家餐廳的特色與評價。在正確的時間、正確的地點,取得正確的資訊,正是AR應用的關鍵。

AR還有幾項發展優勢:第一,使用者不需固定在某個位置、某個特定的設備前,可以使互動更加隨意自然。第二,在真實環境中加入感官刺激,可以維持原有的情境脈絡與空間感,比較容易適應跟學習。第三,可以融入日常生活當中,增加工作效率與生活品質。上述幾點都是VR所無法達到的效果。

AR的技術原理:真實世界的辨識

為了要在正確的時間、地點取得正確的資訊,AR必須先對真實世界進行辨識後才能提供所需的資訊。辨識的方法主要可分成兩大類:「標籤類」與「非標籤類」。標籤類指的是在真實世界的物件上賦予特定標籤(如二維條碼、特殊辨識圖樣),透過這些標籤就能聯結資料庫,給予該標籤載體的相關資訊。

例如寶鹼的Always產品使用的行銷方案:「Always.com/3D」,點選此網址,就可以看到AR兩步驟指示:

1. 印出一張PDF檔案,看起來只是一個炫麗的圖樣而已,但其實這圖樣就是AR技術來判別的特殊圖騰。

2. 將這張圖片放在電腦攝影機頭前面,到它的網頁,它會自動連到Webcam,將你的影像秀在上面,偵測到這個AR特殊圖騰後,網頁會跳出一頂魔術師的帽子,還有一隻兔子!

3. 若動一動那張紙,兔子也會跟著轉向,還會跳出廣告詞:「無法抗拒的柔軟」(irresistibly soft)。

Zugara(http://www.zugara.com/)也推出「線上試衣間」,先列印出每款衣服的特殊辨識碼,利用Webcam就能立即「試穿」!

Zugra

 

AR的技術原理:數位資訊與真實世界的結合

根據定義,AR系統中的透視顯示器必須能呈現虛擬與真實資訊的結合。雖然這類顯示器以「頭戴式」(head- mounted display, HMD)最為常見,讓顯示器置於眼睛前面,很小的螢幕即可製造出大影像的效果。另外也有「手持式」或「固定式」顯示器。

這種裝置可分為兩大類:「光學式透視」以及「視訊式透視」。光學透視顯示器的原理是利用分光鏡(beam splitter,一種半鍍銀的鏡子,既能反射光也能讓光穿透),把分光鏡擺在使用者眼前的正確方位,既能使電腦顯示器的影像反射進入使用者的視線,又能讓周遭環境的光線穿透進來。這種分光鏡也稱為「合併器」,目前已應用在戰鬥噴射機飛行員的抬頭顯示器上,它會把儀表數據投影到擋風玻璃上,便於飛行員隨時監看,近來也有些高級汽車開始使用這種裝置。

在分光鏡和電腦顯示器之間放幾個透鏡,即可調整影像的焦點,使它看起來像是隔著某個舒適的觀察距離。如果左右眼各有一組顯示器與透鏡,即可以產生立體的視覺效果。

視訊式透視顯示器的製作原理則恰恰相反,它使用原本為電視特效而開發的視訊混合技術,把頭戴式攝影機傳來的影像與合成的圖像結合,合併後的影像會呈現在一個不透明的頭戴顯示器上,透過精細的設計使攝影機定位,模擬使用者眼睛的視線,合成出使用者不戴顯示器時會看到的畫面,讓使用者彷彿直接看到真實的影像。就像光學式顯示器一樣,只要左右眼各有一套系統,即可提供立體視覺。

視訊式透視顯示器結合影像的主要方法有幾種。第一種是使合成的圖像與某個預留的背景相抵消,把攝影機回傳的影像與合成影像一一進行比對,當來自電腦合成圖像的某個像素為背景顏色時,顯示器就出現攝影機影像的像素,反之則出現合成圖像的像素,此時圖像會遮住後面的真實物件。第二種方法是使各個像素所儲存的資訊利用各自不同的頻道,指示應該由虛擬資訊決定的像素比例,這種技巧可以合成半透明的影像。

若系統可以判斷真實物件與使用者的距離,則電腦也能夠計算,產生出真實物件遮住遠處虛擬物件的影像幻覺(光學式透視顯示器也有這種功能)。

這兩種透視顯示方式各有優缺點。光學式透視顯示器系統的使用者,可以看見絕對清晰的真實世界,但目前光學式透視系統中的覆蓋圖像是透明的,無法完全遮蔽後方的實物,因此在某些背景之下,覆蓋的圖像或文字資訊看起來會很吃力,而且這種影像立體效果有限,可能無法製造出足以亂真的幻覺。

此外,使用者看實體物件時,雙眼視線聚焦在物體上,但看覆蓋圖像時則聚焦在顯示器平面上,因此雖然其投射原理就幾何學來說是正確的,但實際上使用者並無法同時聚焦在這兩個物件上。

與光學式透視顯示器的缺點相較,在視訊式透視系統中,虛擬物件可以完全遮住實體物件,並以各式各樣的電腦繪圖效果與實體物件合成,且由於虛擬和實體物件的影像均顯示在螢幕上,因此沒有聚焦差異的問題。然而,目前視訊技術尚未達到完全擬真的水準,攝影機和顯示器的品質仍然比不上人類的雙眼,所呈現的視覺品質還相當差。

蘇澤蘭和學生最早設計的透視顯示器,是由陰極射線管與龐大光學儀器組成的笨重裝置。如今,研究人員使用小型液晶顯示器和先進的光學設計,建造出來的系統只有幾十公克重。顯示技術目前仍在持續開發中,例如「微視」公司(Microvision)最近開發出一種使用低功率雷射直接從視網膜掃描影像的裝置。有一種頭戴式顯示器原型看起來非常像眼鏡,戴起來較不引人注目;另外還有一種顯影方式,可以把圖像直接投影到使用者周遭環境的表面。

AR的相關應用

AR的相關應用相當多元,例如在工業上能夠幫助技師修理汽車:

或是讓玩家得到更特殊、有趣的遊戲經驗,例如美國的棒球卡公司Topps推出的Topps 3D Live卡,球卡收藏者只要拿著一張 Topps 3D Live 棒球卡,放在網路攝影機鏡頭前,就會在電腦螢幕上看到出現一個球員的三度空間影像。擁有 3D Live 卡的卡友不只可從電腦看到球員的 3D 影像,還可利用電腦鍵盤,玩基本的傳接和打擊棒球的遊戲。這項技術已經運用在主題公園,以及一部分的汽車設計作業。

甚至是在自己的書桌上跟迷你玩偶女友做互動,例如AR-Figure

AR應用的新曙光:智慧型手機的逐漸普遍

無論頭戴式裝置能夠提供多好的資訊整合呈現效果,截至目前為止都尚未有輕薄、方便的商業化產品問世,即便這些裝置能夠在正確的地方與時間提供正確的資訊,其使用經驗卻是大多數人不習慣的。然而,隨著搭載攝影鏡頭的智慧型手機逐漸普遍,AR的相關應用也逐漸如雨後春筍般冒出。例如Android手機上相當熱門的應用程式(application)「WikiTude」(http://www.wikitude.org/),透過GPS定位,該軟體能即時將Wikipedia上的相關資訊結合到真實地物上,堪稱是背包客必備的軟體之一。

WikiTude

 

類似的軟體還有Layar(http://www.layar.com/),一樣透過GPS定位及數位羅盤,該軟體能夠將合作廠商的相關資訊結合到真實景物上,如下面這段影片所示。

Layar

 

AR的未來展望

去年的red dot design概念獎得主其展出品就是AR應用的產品:「Looking Glass」


圖片來源

透過該產品,我們能夠輕而易舉地得到真實景物的資訊:


圖片來源
 


圖片來源

透過觸碰,能夠拉出真實景物更多的「內在資訊」:


圖片來源

即時翻譯單字:

圖片來源

透過AR,我們將能夠更有效率地處理真實世界的資訊,進一步提昇生活品質。然而,真的沒有任何壞處嗎?在下面這段影片,它替我們揭示了另外一種可能:一旦AR大量普及後,人類將不可避免地被更多資訊轟炸,且這一次這些資訊是直接疊加在你所看到的真實景物之上,無所逃遁。

Augmented (hyper)Reality: Domestic Robocop from Keiichi Matsuda on Vimeo.

發表新回應

這個欄位的內容會保密,不會公開顯示。
  • 自動將網址與電子郵件位址轉變為連結。
  • 可使用的 HTML 標籤:<a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • 自動斷行和分段。

更多關於格式選項的資訊