AI 週報 (Apr , W4)
關鍵字: Guide Dog, ImageNet, AI Trend, AI Application, Machine Learning
作者: Joseph Chang
聯絡方式: ai.free.startup@gmail.com
更新時間: 2021/04/24
1.美國加州 Berkeley大學研發導盲用機器人 — 小獵豹
為什麼研發: 提供一款能夠安全引導盲人前往目的地的四足機器人,無論空間大小都能經過AI辨識系統調整路線,帶給有需求的人們多一種選擇。同時減少訓練專業導盲犬所需之經費及時間。
如何運作: 經由配備於小獵豹前方之雷射測距儀來掃描周遭地形,並且經過計算取得最短路線,如果途中遭遇障礙物即可重新計算修正。同時還帶有攝影機隨時可以主人的行動,
開發重點: 增加腿部工作空間,全身輕量化設計,著重於關節連接處之穩定性與運動能力,AI地理環境資料庫更新與計算系統的優化。
小獵豹的下一步: 控制成本,提供一款可以大量生產的導盲機器人是該團隊目前主要前進的方向,未來還將導入小獵豹專屬的行事曆與更進一步的導航測試。
潛在問題: 大多數導盲犬的主人對於導盲犬的需求不僅僅是帶領他們出門,更是一種精神上的寄託,對於他們而言,便利性及準確度不一定是他們的首要考量,在情感上所帶來的影響和心靈的連結更是許多視障人士所在乎的要素。
2. ImageNet 啟用自動模糊人臉系統,保障隱私權新主張
為什麼研發: ImagenNet團隊一直以來致力於開發物體識別的演算功能,由於此項技術已經危害到一部分的民眾的隱私權,在美國的一些州及城市已經開始禁止當地政府使用這項技術,為了更完善的提供服務,如今ImageNet已經對其資料庫中的30萬張照片進行模糊處理。
如何運作: 藉由Amazon 的人工智慧服務Rekognition來模糊人臉,藉由在每一張照片中的人臉周圍繪製一個框架,由操作人員檢查並且修正框架形狀大小,同時進行框框內的高斯模糊(這個技術雖然不用AI,但是這個技術應該也可以放個圖片或GIF解釋)。除了照片中包含單純的人臉以外,由於許多圖片同時附有口罩或是其他物品,導致AI辨別分類的錯誤率提升,用於訓練模型的準確度還需要經過更進一步的修正。
ImageNet的下一步: 據VentureBeat 表示,經過人臉模糊過後的版本才會是ImageNet的全新型態,除了目前此功能僅用來模糊人臉之外,在未來的自動模糊功能也將擴展到Google Street View中的面部與車牌,同時也能用來訓練自動駕駛車輛的數據以及動作識別系統的模型。
延伸案例: 雖然此版本是針對人臉來進行的修正,但是對於一些沒有人臉的照片來說反而波動更大。一篇針對ImageNet的研究中提到在「哈士奇」與「愛斯基摩犬」的分類比較裡,哈士奇的識別準確率比以往上升了近17%,而愛斯基摩犬的辨別率卻下降了約13個百分比。由於此兩種分類裡皆沒有人臉,目前連作者本人都覺得相當奇妙,詳細原因還要等待後續研究。
3. Virginia Tech 工程教授按照蝙蝠原理研發聲音定位裝置
研發背景: 受到蝙蝠接收聲音的原理啟發,機械工程學教授(Rolf Mueller)決定創造比人類耳朵還要更簡單與準確的聲音定位模型。該發明目前透過單一接收器來達到單一頻率精準的定位,有別於目前人類有兩隻耳朵同時判斷方位,團隊在研究一篇1967年的發現後表明,當接收器的數量減少到一個時,如果遇到不同的頻率,單一接收器即可快速找到聲音的位置並且與發生物體進行配對,未來的研究也將朝著單一接收器及單一頻率的方向前進。
如何運作: 由於團隊目標使用單接收器及單頻率的收音模式,Mueller的團隊嘗試複製蝙蝠移動耳朵的能力,他們創造了一種柔軟的耳朵模型,放在簡單的馬達及繩子上。透過特別的耳廓設計,讓接收器利用耳朵的形狀來使音頻進行迴繞,最後引導到耳道中。Mueller將耳朵放在麥克風的上方,用震動的方式來提供信號。但是由於蝙蝠耳朵複雜的構造使得團隊無法模擬,所以他們引入了一個深層的神經網路,透過機器學習模仿大腦中運作的多層次處理過程,提供每個接收到的音源的相對位置。
實際運用與未來展望: 目前Mueller表示將會更加提升該裝置的精確程度與實用性,未來希望可以應用於農業及林業中,帶來環境監測以及針對生物的多樣性監測功能。也可能應用於國防安全的相關領域中。
4. 參考資料來源: