(作者:劉育成老師 / 逢甲大學電聲碩士學位學程)

AI人工智慧是目前最夯的議題,古已有之,正所謂“聞聲知人”,透過人的聽覺器官,可以分辨出爸爸、媽媽等不同人的聲音,由麻省理工學院(MIT)所打造出來的AI,研究人員用一個由數百萬個影片剪輯而成的數據集,對一個名為Speech2Face的神經網路模型進行自我訓練,利用語音編碼器與臉部解碼器,僅用了6秒,就能靠著聲音來還原人臉,效果上是令人滿意的。這個技術是透過所謂的聲紋當作主要的研究主軸之一。

人工智慧語音應用服務布局範疇
資料來源:工研院IEK Consulting(12/2018)

每個人的聲音都有其獨特之處,就跟指紋一樣,每個人都有獨一無二的聲音,透過聲學儀器,可以分析出獨特的頻譜圖,從聲紋裡面可以判斷出很多生理資訊,如:年齡、性別、種族等資訊,心理資訊也可獲得,例如:情緒、健康等資訊,比其他辨識方式涵蓋更多的個人訊息在裡面,因此聲紋辨識有其獨特性與穩定性。2019年的WWDC全球開發者大會上,Apple正式宣布HomePod將加入聲紋辨識功能,讓用戶在使用智慧音箱時,能更安心、更有保障。如今也有消息傳出,Siri也要加入聲紋辨識系統,當使用者在說出「Hey,Siri」時,Siri就會開始透過分析聲紋來知道是不是主人在呼喊他。

圖:話者發聲中截取出的30毫秒長度的信號
原文網址:
https://kknews.cc/tech/vb94p4.html

根據研究,每個人都有其獨特地說話習慣,有些人頻率較高,有些人說話較沙啞,有些人聲音分貝就是天生大,這些聲音在頻譜上的呈現,都有如密碼般的存在,而且聲音的判讀,也可以預防是否為錄音的罐頭聲,有效預防犯罪的發生。近日,花旗銀行繼美國之後,台灣為第2個導入聲紋辨識技術的市場,領先亞洲各國。遠傳電信也於今年導入聲紋辨識系統,每次打電話給電信公司客服時,客服人員總要先確認來電的是否為本人,用戶得輸入身分證、密碼,或是回答幾個問題,如「您國小讀哪間學校?上一次繳款是透過什麼方式?」這些問題用來確認用戶身分,就算真的是本人,也不一定能立刻答出正確答案。一方面得花不少時間,另一方面這些問題的答案仍然很可能被其他人所冒用,採用聲紋辨識技術後,每通電話客服用於確認身分的時間,從原本的45秒縮短至15秒。至目前為止,匯豐、渣打、摩根大通均使用等銀行都在用「聲紋」當作身分辨識方式(voice ID)之一。在網路與行動通訊日漸普遍的趨勢下,以聲音作為人機介面,用以擷取資訊,將會是未來的重點。而資料安全的考慮,有很大的機會需要做個人身分的驗證,聲紋辨識是一項必要的技術。

聲紋辨識的導入,以大數據分析預測用戶撥打的需求,根據統計線上自助解決率高達95%,可大大減少人力成本,並且可24小時全年無休的方式進行繳費、查詢、掛失等簡易服務,而個人聲紋的資料庫建立,應用於打擊犯罪、政戰時期,可加快辦案速度,聲紋會不會是繼“Face ID”之后,即將加入手機裝置系統,成為辨識身分的新密碼嗎?

【延伸閱讀】

※館藏資源

生物辨識+金融科技 兵家必爭 (聯合知識庫)

聲紋支付 防金融詐騙 (聯合知識庫)

※網路資源

遠傳導入聲紋辨識核對身分 打造專屬「聲分證」