Meta語音翻譯系統誕生 幕後推手之一是臺大資工系校友陳鵬仁

Meta 創辦人馬克・祖克伯2022年在個人 Facebook 帳號上發布影片,與來自臺灣出生的工程師陳鵬仁,二人分別以英文與臺語對話,透過語音翻譯系統一來一往,沒有障礙,宣告全世界第一個無標準書寫語言語音翻譯系統的誕生。陳鵬仁是語音翻譯系統的幕後推手,也是臺灣大學資訊工程學系的校友,他與臺大學弟妹們分享一路在機器學習與語音翻譯的研發過程。因為自己從大學期間對AI與機器學習非常感興趣,一直朝這方面學習,也加入系上老師的實驗室。

語音到語音翻譯系統,沒有文字也能溝通無礙
「Meta Universal Speech Translator (UST,通用語音翻譯工具)」,是 Meta AI 開發的英文與多種語言間的語音翻譯系統 。陳鵬仁說,口語表達是人類溝通的主要方式之一。發展語音系統的初衷,是希望解決人與人之間的溝通障礙,以及語言翻譯變得更即時。

在傳統的技術上,語音到語音的翻譯系統可以透過結合語音辨識、文字翻譯和語音合成系統,將A語音翻譯為B語音。然而,如果A語音沒有對應的文字,這套中間經過文字的翻譯系統就無法運作。因此,Meta AI 此次嘗試開發支持無標準書寫語言的「語音到語音」(speech-to-speech) 翻譯系統,希望讓沒有文字的語言 (unwrtitten language) 使用者,也能受惠於最新的機器翻譯技術。而英語到臺語的翻譯系統,就是這項願景的第一步。

「鄉土劇」台詞,化身機器學習資料
Meta AI 的研究團隊選擇以臺語為開發對象,是因為在翻譯上的困境與無文字語言類似,雖然臺語有標準書寫語言但目前並沒有被廣泛地使用。大多數臺語使用者常常會因為個人習慣的不同,而使用不同的文字來表達相同的句子,這使得訓練臺語文字翻譯系統變得非常困難。為此,Meta AI 團隊研發一套從臺語語音直接翻譯到其他語言,不透過臺語文字的技術,成功打造出臺英語音翻譯系統。在研發過程中,他們採用3萬小時的臺灣鄉土劇中的臺語資料以及8萬小時的英文電子書籍作為學習資料基礎,蒐集到100小時的英語臺語的語音翻譯資料做訓練。這套系統展示了無文字語言的語音翻譯系統的可行解決方案,將來期望能將這個技術推廣到更多無書寫文字語言。

鼓勵學弟妹趁大學時多嘗試、多實習
陳鵬仁說,除了專業知識外,在校園裡與充滿熱情的人嘗試不同事物的經驗是他一輩子的養分。大學時影響最深的是資訊系教授林智仁,在其帶領下接觸機器學習領域,引發興趣;更重要的是老師的熱情、價值觀以及對學生的照顧,也在陳鵬仁心裡設下標竿,成為他為人處世的準則。林軒田教授扎實的機器學習課程也為他日後工作打下厚實基礎。另外,臺大豐富的社團也讓他多方嘗試各種活動,讓他找到日後的興趣並結交許多好友。

陳鵬仁說,大學是面臨人生各種重要選擇的時間點,心裡若對未來還有許多不確定,善用這段時間多方嘗試並蒐集資訊,能更容易幫助自己做出滿意的決定。除了在校不有同的專業課程以及研究機會,另外,也可把握業界的實習機會,利用二、三個月了解公司的文化,分工,商業模型等。在完成專案的過程了解自己的喜好,為工作所提供專業價值。擁有這些經驗在未來職涯的選擇時會更有概念,更能了解自己追求的目標,在學校的學習也能提供更多動機。