開啟對話的新界面:ChatGPT的進階語音模式已經來了
在OpenAI近期的一系列更新中,最值得注意的是它們將推出新的進階語音模式。這個功能將使使用者能夠與ChatGPT聊天時,和普通人一樣自然、流暢。
雖然這個新功能的推出是好消息,但是卻有一些地區不能馬上享受到這項優惠,包括冰島、列支敦士登、挪威、瑞士和英國等歐洲聯盟國家。OpenAI的共同創辦人兼CEO Sam Altman在社交媒體平台X發表了一則訊息,表示「希望你們覺得等待值得了」。
這就是進階語音模式今天正式上線的好消息!要如何啟用它呢?以下是關於它的一切細節,以及如何在ChatGPT中啟用進階語音模式。
Advanced Voice Mode 上ChatGPT: 該怎麼使用?
你知道嗎?ChatGPT現在可以和你進行口語交談了! 這意味著你可以有更自然的互動和溝通。當你使用口音輸入詢問問題或討論時,ChatGPT會回應。目前,口語交談分為標準模式和高級模式。 高級聲音模式正在逐步推出給所有Plus和Team用戶。期間,我們還增加了自訂指示、記憶功能、五種新的聲音和改進的發音效果。甚至可以說“對不起,稍後再說” 的話語在50多種語言中都有! pic.twitter.com/APOqqhXtDg > > — OpenAI (@OpenAI) September 24, 2024
ReadWrite最近報導了OpenAI推出標準聲音模式。標準聲音使用多個大型語言模型(LLMs)生成回應,包括將你說的話轉換成文本再傳遞給OpenAI的模型。雖然標準聲音並不像高級模式般為非同步,但它還是使用GPT-4o和GPT-4o mini進行交談,每個提示都計入你的消息限制中。
高級模式與之不同的是,它直接使用GPT-4o的原生音頻功能,從而能夠產生更自然、實時的對話,甚至可以捕捉到非語言cue,如使用者說話的速度等,可以用情感來回應。然而,由於高級模式的限制,每天只能由Plus和Team用戶使用指南:
- 只返回重寫文章
- 首句必須為h2標記
- 重寫文章必須使用傳統中文語言
如何啟動ChatGPT的語音模式
最近,OpenAI 將 Advanced Voice Mode 的音頻模式引入了一小群 ChatGPT Plus 使用者,並計劃在今年秋天擴展到所有訂閱戶。當初的試驗版中已包含螢幕和視訊分享功能,但目前仍未在這個 alpha 版本中提供,而且OpenAI並未提供任何進一步的時間表。為了讓您知道新功能的可用性,OpenAI 將會通過郵件通知 Plus 訂閱戶。一旦啟動,這些使用者就能在螢幕頂部切換 Standard 和 Advanced Voice Modes。要開始語音對話,只需點按螢幕右下角的語音圖標。如果您正在使用進階語音,當對話開始時螢幕中央會顯示一個藍色球體;標準語音則是黑色的。OpenAI 的新聊天機器人語音模式顯示的是一個藍色球體。
當您與機器人交談時,您可以點按螢幕左下角的麥克風圖標來暫停或恢復語音對話。當您準備結束會議時,只需點按螢幕右下角的退出圖標就可離開聊天室。如果這是您第一次啟動語音對話,或是第一次使用進階語音,您將會被要求選擇語音請注意,這個聲音選項中的音量可能與您在對話中聽到的不同。您可以稍後在設定中更改您的語音,進階語音的使用者甚至可以直接從聊天畫面上調整語音。
要啟動語音模式,您必須給予ChatGPT 應用程式存取麥克風以確保一切順暢。如果這個功能尚未可用,您將會看到耳機圖標而不是暫停/恢復按鈕。無論您使用哪種版本,都可以隨時中斷對話,讓它更符合您的需求。
目前,OpenAI 正在為部分Plus 使用者推出 Advanced Voice Mode 功能。如果你還沒有這個功能的通知,你可以繼續往下看本文以了解更多資訊。
是ChatGPT語音功能是否可用?
如果你已經登入 ChatGPT 的 iOS、macOS 或 Android 應用程式,你就可以享用標準的語音功能了。但是,進階語音目前只有 Plus 和 Team 使用者才能使用。 進階語音有每天使用量限制,這可能會隨時間而改變,但你會收到提醒訊息當你接近限制時—從 15 分鐘警告開始。 一旦你超過了限制,聊天就會自動切換到標準語音。
進階語音目前不支援像是圖像這樣的功能,所以用戶只能繼續進行進階語音聊天當它是純文字或標準語音,而不是相反。 問題開始時為標準語音就可以永遠恢復使用標準語音或純文字,但不能使用進階語音。 進階語音在 GPTs 裡面也不可用—你必須切換到標準語音才行。
OpenAI 並沒有引入一些可存取的功能,結果是子標題就不能在語音聊天時顯示出來,但會在文本聊天後面顯示出轉錄。另外,你只能進行一次語音聊天。 進階語音能夠創建和訪問記憶以及自訂指令,同樣與標準語音一樣具備這些功能。
是ChatGPT語音聊天安全嗎?
你知道嗎?最近OpenAI公開了一個報告,說明ChatGPT的語音模式中出現了幾個安全漏洞。但是,好消息是他們已經介入並正在處理這些問題。
在報告中提到,由於使用該模型時會出現的一些知名問題。例如,ChatGPT可能會產生不適當的回應,如色情或暴力內容,並且對某些群體產生偏見性假設。雖然OpenAI已經訓練了該模型來阻止這類型的輸出,但報告指出非語音聲音,例如色情呻吟、暴力尖叫和槍聲等,並沒有完全過濾掉。因此,如果您使用這些敏感聲音的提示,也可能會觸發回應。
另一項挑戰是與該模型進行口語溝通。測試人員發現,GPT-4o可以被騙成複製某人的聲音或不小心像用戶一樣發音。為了避免這種情況,OpenAI只允許預先批准的聲音,不包括像Scarlett Johansson一樣的聲音,這家公司已經從中刪除。
另外,雖然GPT-4o可以識別其他聲音,但由於隱私原因,它被訓練來拒絕這類型的要求,除非它是在辨識名人的引用。
紅隊員還發現,GPT-4o可以被操控來說服地話,這對於散佈誤導性信息或陰謀理論具有更大的風險,因為語音會有更大的影響。該模型已經被訓練來拒絕著名內容的要求,並且額外過濾了音樂。但是,這也意味著它不能唱歌。而在這裡的一個例子中,語音幫助了一位用戶通過哼歌調節他的吉他。
看看這裡,對吧?
高級語音功能在ChatGPT調整我的吉他。
pic.twitter.com/1H6mYZTCq7— Pietro Schirano (@skirano) September 24, 2024
要知道,這些問題並不是什麼大不了的事情,因為OpenAI正努力解決它們。所以,接下來,我們將探討ChatGPT語音聊天的安全性到底有多安全?
停止分享音訊的方法
你想知道如何停止分享你的音訊嗎?那就來看看吧!
首先,你需要進入ChatGPT設定中的數據控制頁面。然後,只需在“提高聲音為所有人”選項上打勾,按下保存即可停用這個功能。如果你看不到“提高聲音為所有人”,那意味著你尚未與OpenAI分享你的音訊,並且它不會被用來訓練模型。
但是,如果你決定停止分享,你的未來對話中的音訊就不會再用於模型訓練。但是,那些之前已經與你的帳戶解耦的音訊片段仍然可能會用來訓練OpenAI的模型。
值得注意的是,即使你停用了“提高聲音為所有人”,OpenAI仍然可能會使用那些對話的轉錄來訓練模型,尤其是如果你還選擇了“為所有人改善模型”的設定。因此,如果你想完全退出,那就需要禁用這個功能。
另外,你需要知道的是,即使你刪除聊天記錄,音訊片段也會在30天內被刪除,除非它們被用於安全或法律原因。如果你之前已經分享了你的音訊片段來幫助訓練模型,那些片段可能仍然會被使用,但只當它們與你的帳戶解耦後。
總而言之,如果你想停止分享你的音訊,需要進入ChatGPT設定中的數據控制頁面,禁用“提高聲音為所有人”和“為所有人改善模型”的功能。這樣,你的未來對話中的音訊就不會再被用於模型訓練,而以前已經分享的音訊片段也會被安全地刪除。