中國 AIGC 產業峰會 | 科大訊飛 AIGC“上新”時!
2023 年,AIGC 爆發出前所未有的發展潛力,其中不斷完善的深度學習模型、開源模式的推動,以及大模型探索商業化的可能,成為了 AIGC 發展的“加速度”。AIGC 或將會改變內容領域的生產方式,帶來整個行業的變革。
3 月 29 日,量子位主辦的中國 AIGC 產業峰會在北京舉行。大會以「Hello New World」為主題,AIGC 領域學界、產業界的專家學者齊聚一堂,從產學研等多維度,覆蓋大公司玩家、創新創業公司、學研和創投代表,全方位探討和分享中國 AIGC 產業的現狀、機遇和未來。科大訊飛 AI 研究院常務副院長高建清受邀參加并作主題演講。
在《AIGC 技術探索與應用創新》的演講中,高建清分享了基于文本預訓練、多模態預訓練、多元異構基礎資源構建、異構集群構建及大模型訓練套件,訊飛在音頻創作、視覺創作、文本創作等方面的研究和應用。
高建清表示,科大訊飛的 AIGC 整體布局可以總結為三層架構:“底座 + 能力 + 應用”,是,形成了音頻創作、視覺創作、文本創作三大 AIGC 能力,進而衍生出在教育、醫療、人機交互等領域的豐富應用。
關于“底座”,科大訊飛以文本預訓練、多模態預訓練、多元異構基礎資源構建、異構集群構建及大模型訓練套件為技術底座,充分培養出強大的 AIGC 能力,并能結合實際應用。此前,科大訊飛擁有的扎實技術積累就已經鑄就了其語音 AI 龍頭地位,憑借其在語音合成、語音識別、機器翻譯以及自然語言理解等核心技術上的深厚的積累,在 AIGC 火熱的背景下,自然擁有著乘風而起的底氣。
關于“能力”,科大訊飛由底層技術延伸出的三大 AIGC 能力分別為音頻創作、視覺創作和文本創作。
在音頻創作方面,多風格多情感語音合成系統 SMART-TTS 是訊飛研究院此次的重磅技術突破之一。高建清分享了科大訊飛研究院在虛擬聲音自動創造和多風格多情感語音合成系統 SMART-TTS 上的技術進展和成果,拋棄生硬的機器人“口音”,語音合成將變得更加具有“喜怒哀樂”。在此創新下,語音合成從依據真人生成走向語義可控生成,音色、韻律、口音等還可根據自己需要進行控制和調整。
在視覺創作方面,你對 AIGC 的印象還停留在“AI 作畫”嗎?現在,制作獨一無二的虛擬人才是最“潮”玩法!
作為國內較早開展虛擬人技術研究的人工智能公司,早在 2018 年,科大訊飛就發布了多語種虛擬人口唇驅動,2021 年發布 2D 真人捏臉系統;目前已形成了從 3D 虛擬形象口唇表情和動作的 AI 驅動到 AI 貫穿 3D 形象構建的全流程。目前,科大訊飛 AI 虛擬人已廣泛應用于媒體、金融、文旅、教育、政企等多場景。。隨著 AIGC 的發展,其 AI 生成的應用場景將更加廣闊。
基于在 AIGC 各方面的技術積累與行業應用經驗,訊飛推出了 AIGC 內容創作平臺 —— 訊飛智作和訊飛音樂的詞曲家平臺。訊飛智作平臺為用戶提供 AI 配音、虛擬人音視頻播報、聲音定制、形象定制等服務,一鍵生成定制化音視頻,其平臺界面清晰,操作簡單,使用門檻低,真正實現讓 AIGC 的技術飛入尋常百姓家造福社會。作為面向廣大詞曲作者和采買方的詞曲創作交易平臺,詞曲家平臺不僅提供了輔助作詞、輔助作曲和歌曲試音、質量分析等 AI 輔助工具,還能夠幫助廣大音樂人有效縮短交易路徑,獲得更多收益與安全交易保障,助力詞曲創作交易良性發展。
高建清在大會上表示,訊飛將在認知智能大模型核心技術的研發基礎上,重點結合教育、醫療、人機交互、辦公等若干領域方向進行應用落地探索,并將持續賦能行業,促進數字經濟發展與產業進步。
科大訊飛此次 AIGC 布局的分享,展現了其在技術層面的強大底氣,致力于用 AI 技術賦能行業及個人,其在具體應用場景上所體現出的企業社會責任感只增不減。
隨便看看:
相關推薦:
網友評論:
推薦使用友言、多說、暢言(需備案后使用)等社會化評論插件