機器視覺影響我們發(fā)展人工智能的五種方式
時間:2024.10.08來源:深淺優(yōu)視點擊次數(shù):653次
1.智能小助手在視覺上開戰(zhàn) 隨著我們的系統(tǒng)越來越接近于“人性化”——就像人工智能,它將更需要視覺數(shù)據(jù)來進行學(xué)習(xí)和處理其他數(shù)據(jù)。在LDV 峰會上,Evan Nisselson說到:“這是所有主要公司都想在激烈的競爭中擁有我們的活動視覺數(shù)據(jù)的原因之一。”“為了做到這一點,他們需要擁有攝像機。”例如,亞馬遜最近為其以Alexa作為語音助手的智能設(shè)備—— Echo,添加了一臺攝像頭,而Google和Facebook最近又發(fā)布了新的增強現(xiàn)實研究的聲明。
2.光學(xué)器件足以引導(dǎo)無人駕駛車 我們經(jīng)常會看到類似于這樣的爭論——無人駕駛汽車是否需要LiDAR,或者說是僅依賴于光學(xué)的解決方案就已經(jīng)足夠。例如,特斯拉首席執(zhí)行官Elon Musk認為,體積龐大且昂貴的設(shè)備LiDAR通過使用激光器實時地對其環(huán)境進行映射不是駕駛時所必需的。 Wheras Humatics 的首席技術(shù)官Gregory Charvat在發(fā)布會上表示,汽車“不僅僅需要光學(xué)傳感器平臺[相機],他們也需要比差分GPS更精確的LiDAR,雷達和高精度無線電導(dǎo)航。”
LiDAR和雷達通過范圍和角度來精確定位周圍環(huán)境中的實際物體,而基于用相機解決問題的深度學(xué)習(xí)則需要通過算法運行圖像,并且即便這樣,最終仍只能取得一個預(yù)測的結(jié)果。然而,光學(xué)解決方案能在實際生活中識別某個地方效果更好,就像一個行人和一串像圣誕樹的像素點相比,在Auto X 的創(chuàng)始人兼CEO Jianxiong Xiao的令人印象深刻的演示中,他們的公司可以只使用相機來低成本的解決無人駕駛汽車的問題。
由于技術(shù)上的優(yōu)缺點,汽車公司通常提前五年來進行戰(zhàn)略研究,所以現(xiàn)在需要購買一些必備的硬件來確定2021年的最后生產(chǎn)時限。目前,LiDAR和一些更先進的雷達依然很昂貴(對于前者來說即便80,000美元也被認為是便宜的)、笨重。同時,如果要以一種混合的方式運行所有這些光學(xué)技術(shù)和傳感器技術(shù),需要一臺足夠小的能適應(yīng)汽車的超級計算機。
3.視覺系統(tǒng)能讓機器比通過機器學(xué)習(xí)學(xué)得更好 LDV中的幾個演示提醒了我們,機器不僅僅通過神經(jīng)網(wǎng)絡(luò)和機器學(xué)習(xí)來學(xué)習(xí)。他們還有其他方法來學(xué)會識別和分析他們周圍的世界。Google研究的科學(xué)家Tali Dekel展示了一種技術(shù),使用計算機視覺來進行識別,通過將屋頂上的直線或紫色水果中所存在的偏差放大,然后來判斷。例如,確定舊房子的結(jié)構(gòu)是否存在問題,或者是某個西紅柿是否比其他的成熟的更好,更飽滿。看似很簡單,但這是計算機視覺優(yōu)于人類的地方。
4.機器視覺可以幫助醫(yī)療診斷 病理學(xué)家平均每天有500張幻燈片要處理,而每張幻燈片又包含數(shù)十萬個需要分析的單個細胞,如果有癌癥的存在,那么醫(yī)生很容易將其遺漏。“對于人類來說,我們無法像計算機一樣高效的工作,只因為我們無法去仔細觀察每一個單元格”,PathAI的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Andrew Beck表示,“但我們認為電腦每次都能做出完美的診斷。”
根據(jù)美國醫(yī)學(xué)協(xié)會的一項研究,對于一項正確的診斷,通常只有不到一半的病理學(xué)家會表示贊同。引用另一項重點研究乳腺癌淋巴結(jié)活檢的例子,Beck說明了計算機與人類病理學(xué)家所關(guān)注的側(cè)重點之間的區(qū)別;前者強調(diào)了許多會成為癌細胞容器的區(qū)域。Beck說:“我們?yōu)椴±韺W(xué)家提供原始圖像,然后他們?nèi)匀豢梢匀ゲ榭此麄兯煜さ臄?shù)據(jù),和那些由學(xué)習(xí)系統(tǒng)處理了的圖像,基本上這就可以確定癌癥的區(qū)域,然后醫(yī)生就能通過專門研究這些區(qū)域作出診斷。”乳腺癌研究表明,如果沒有人工智能,這種活檢只有85%的準確率。而如果使用人工智能作為輔助,錯誤率將下降到只有5%。
5.計算機視覺領(lǐng)域的門檻變得越來越低 優(yōu)質(zhì)相機,傳感器和深度學(xué)習(xí)軟件庫(如Google TensorFlow)的商品化大大擴展了計算機視覺的使用范圍,我們看到許多新的初創(chuàng)公司出現(xiàn)。在Vision Summit舉辦的兩次比賽中,不論是一種能夠從Google對街景視圖圖像進行判斷,然后生成人口學(xué)分析的技術(shù),還是一個能夠?qū)κ鹿拾l(fā)生后汽車的損壞程度進行評估并且計算出維修成本的應(yīng)用程序,我們可以看到這些判斷和分析都僅僅是來源于一張圖片。