国产无码免费,人妻口爆,国产V在线,99中文精品7,国产成人无码AA精品一,制度丝袜诱惑av,久久99免费麻辣视频,蜜臀久久99精品久久久久久酒店
        訂閱
        糾錯
        加入自媒體

        OpenAI再發大招推出Voice Engine!讓失語者發聲只需要15秒音頻...

        2024-04-02 09:07
        新火種
        關注

        作者:小巖

        編輯:彩云

        許久沒有新動作的OpenAI最近顯得頗為低調。但事實上,對于這些卷的不能再卷的AI頭部公司而言,沒有人是敢躺平的。大家不是在發布新品,就是在研發新品的路上。

        3月30日,OpenAI宣布推出全新的人工智能模型——Voice Engine。這并非是一個全新的模型,事實上,自2022年開始,OpenAI便默默布局,開展了對于該模型的研發工作。

        工作原理簡單而高效!能夠駕馭合成聲音所帶來的挑戰和機遇。

        對于這款最新發布的模型,OpenAI官方推特的措辭異常小心而謹慎,它表示,“我們正在分享從 Voice Engine模型的小規模預覽中獲得的經驗體會”。事實上,Voice Eengine所呈現出來的工作效率的確是簡單而高效的。

        圖片1.png

        Voive Engine最大的特點在于語音克隆。其中的工作原理很簡單:用戶僅需通過電話或電腦麥克風錄制一段15秒的聲音片段,OpenAI的語音引擎便能生成“與其聲音高度相似的自然語音”。在此之后,無論是面對什么樣的文本,它都能以近乎完美的克隆聲音進行朗讀。

        這項技術的問世,顯然會對那些經常錄制自己語音的人,諸如播客,配音藝術家,口語表演者,有聲書和廣告解說員,游戲玩家,流媒體主播,客戶服務代理,銷售人員等眾多職業產生重大影響。

        除此之外,OpenAI還特別強調了語音引擎在支持非語言個體方面的獨特能力。它能為這些個體提供個性化的,非機械化的聲音,為那些有語言障礙或學習需求的人提供治療和教育方面的幫助。

        圖片2.png

        一旦技術得以成行,Voice Engine不僅能實現更真實的人聲復刻,更重要的是,它還能適用于各種場景的應用,諸如為孩童朗讀故事,企業產品介紹,醫療咨詢服務,為語言障礙者提供幫助等。它不僅支持多種語言,更能模仿出不同的語調和情感,應用不可謂不廣泛。

        Voice Engine由來已久,相關應用早已有之。

        正如我們前文所提到的那樣,早在 2022 年底,OpenAI 便開發了 Voice Engine 并將其用于支持文本到語音 API 中的預設語音以及 ChatGPT 語音和朗讀。所以,在展望Voice Engine未來可能產生的廣泛應用場景之前,我們不妨看看它曾經有過哪些實用案例。

        首先,Voice Engine可以通過自然,富有感情的聲音為非閱讀者和兒童提供閱讀幫助。這些聲音不是呆板的預設聲音,它代表了更廣泛的說話者。譬如一家名為Age of Learning 的教育技術公司就一直在使用 Voice Engine 生成預設的畫外音(voice-over)內容。他們還利用 Voice Engine 和 GPT-4 創建實時且個性化的回應,從而與學生進行互動。

        圖片3.png

        其次,Voice Engine可以翻譯視頻和播客等方面的內容。通過使用Voice Engine,創作者和企業可以用自己的聲音流利地向世界各地更多的人進行傳播。據悉,HeyGen便是這方面的早期應用者之一。HeyGen是一個人工智能視覺故事平臺,通過使用 Voice Engine 進行視頻翻譯,將演講者的聲音翻譯成多種語言,從而覆蓋全球受眾。值得一提的是,即便是翻譯,Voice Engine也會保留原說話者的母語口音,譬如帶有法語口音的英語等。

        圖片4.png

        此外,Voice Engine可以為不會說話的人群提供支持:為患有影響語言的疾病的人群提供治療應用;為有學習需求的人群提供教育增強功能等。譬如它能夠為不會說話的人群提供多種語言的獨特非機器人語音。用戶可以選擇最能代表自己的語音,對于多語種用戶,它也能使每種口語都保持一致的語音。

        擔心合成技術可能會被濫用,暫時沒有完全公開的計劃。

        盡管語音生成式AI被認為是OpenAI的又一次巨大突破,但很顯然,官方并不急于向外界完全公開Voice Engine。究其原因,主要是因為合成語音技術具有巨大的風險,很可能會被濫用。特別是最近一段時期,由合成語音引發的電信詐騙,版權侵害等社會風險問題層出不窮,這些都是OpenAI做出“暫不公開”選擇的重要原因。OpenAI也表示,在開發的過程中,一直在與政府,媒體,教育等社會各界的美國和國際合作伙伴接觸,保證聽取和采納反饋。特別當下這處于美國大選時期,OpenAI又正與政府和外部企業合作,勢必會采取必要的安全措施和謹慎的態度。

        無獨有偶,OpenAI于2月推出了視頻生成AI“Sora”也同樣未對外界公開。面對生成式AI技術日益普及所引發的濫用風險,OpenAI對商用化明顯采取了較審慎的態度,以確保安全和負責任的使用。

        圖片5.png

        當然,我們無法否認,生成式AI的潛力是無窮的,終究要有落地應用的一天。相較于始終保持“審慎開放”,乃至“拒絕開放”的態度,我們莫不如提前做好評估和防范。譬如要逐步淘汰基于語音的身份驗證作為訪問銀行賬戶和其他敏感信息的安全措施;教育公眾了解AI技術的能力和局限性,包括存在欺騙性AI內容的可能性;加快開發和采用追蹤視聽內容來源的技術,以便隨時明確您是與真人還是與AI互動等舉措,都是勢在必行的。無論OpenAI是否會廣泛部署這項技術,我們大家都要了解它的發展方向。

        最后,我們再來討論一個問題:在生成式AI領域,OpenAI是否依舊領跑?

        從2022年便孵化出了Voice Engine這一點來看,OpenAI是早就開始布局合成語音這一賽道了。從某種程度上說,現在分享的最早期版本很可能只是在小秀肌肉,內部應該已經完成了強力迭代。而且,根據The Information的獨家報道,微軟和OpenAI將合力打造一臺成本高達1000億美元,擁有數百萬個GPU的超級計算機“Stargate (星門)”。它將為OpenAI的人工智能提供巨大的動力和算力會,不夸張的說,照比現在微軟給OpenAI的支持直接提升幾個量級。

        此外,從OpenAI通篇官宣文來看,OpenAI不會在短期內向公眾推出合成語音領域的更新了,畢竟這個賽道日趨敏感。這或許是出于重塑企業形象和公信力的需要。未來我們或許可以期待OpenAI將Sora和Voice Engine以怎樣的模式集成到下一代 GPT。一旦這樣的GPT得以成行,OpenAI在生成式領域的霸主地位將不可動搖。

               原文標題 : 新火種AI|OpenAI再發大招推出Voice Engine!讓失語者發聲只需要15秒音頻...

        聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

        發表評論

        0條評論,0人參與

        請輸入評論內容...

        請輸入評論/評論長度6~500個字

        您提交的評論過于頻繁,請輸入驗證碼繼續

        暫無評論

        暫無評論

          掃碼關注公眾號
          OFweek人工智能網
          獲取更多精彩內容
          文章糾錯
          x
          *文字標題:
          *糾錯內容:
          聯系郵箱:
          *驗 證 碼:

          粵公網安備 44030502002758號

          主站蜘蛛池模板: 91在线观看| 多p在线观看| 久久久黄色片| 伊人99在线| 2025无码| 宁强县| 闽侯县| 无码av在线播放| 北条麻妃无码| 国产在线你懂| 国产人人人| 无码免费一区二区三区| 国产黄在线观看| 亚洲最大的成人网站| jizz日本人妻| 九九全国免费视频| 99啪啪| jizzjizz亚洲| 色天使色综合| 国产乱人伦久久免费| 婷婷亚洲五月花视频| 一本色道久久综合亚洲精品按摩| 91制片厂天美传媒网站进入| 亚洲1234区| 波多野结衣无码视频一区二区三区| 国产免费AV电影| 无遮挡网站| 日韩福利在线视频| 欧美18在线观看| 南阳市| 亚洲黑人av| 蜜臂AV| 黑丝91大神| 精品30P| 欧美A∨| 丁香婷婷社区| 熟女视频亚洲| 鲁鲁美女影院| 91视频网亚瑟视频| 亚洲中文天堂| 辽阳县|