ChatGPT 進階語音模式正式發表!你還在等什麼?

ChatGPT 進階語音模式正式發表!你還在等什麼?

最近,OpenAI 宣佈了新的進階語音模式功能,這使得用戶們可以與其聊天機器人進行自然的對話。雖然這項新功能尚未在歐盟的國家可用,包括冰島、利希滕施坦、挪威、瑞士和英國,但我們已經迫不及待地想知道它會如何改善我們與 ChatGPT 的互動體驗。

OpenAI 的創始人兼 CEO Sam Altman 在 X 上寫了一篇文章,說明了這項新功能的推出時間表:「希望你覺得等待值得了。」他還在 Twitter 上發文,宣佈進階語音模式的推出將於今日開始,並預計一週內完成。

Sam Altman 的帖子顯示,他們對新功能感到非常自信。現在,你想知道它是如何運作的,以及如何啟用 ChatGPT 進階語音模式嗎?接下來,我會帶你進一步了解這項功能,並教你如何啟用它。

這是什麼?ChatGPT 的進階語音模式

你可以透過語音對話和 ChatGPT 溝通,讓你的互動變得更加自然。當你通過語音輸入提問或進行討論時,ChatGPT 會提供口語回應。目前有兩種類型的語音對話 – 標準和進階。

進階語音模式正在陸續推出

我們知道大家都很期待!而現在,我們為你帶來了更多好消息:自定義指示、記憶功能、五個新聲音和改善的口音效果。它甚至可以說出「對不起,我遲到了!」的話語,超過 50 種語言。

這是什麼?

標準語音模式是最近推出的,它使用多個大型語言模型(LLMs)來生成回應,包括將你說的話轉成文字然後傳送給 OpenAI 的模型進行回應。雖然標準語音不是像進階語音那樣多模態,但它仍然會使用 GPT-4o 和 GPT-4o mini 這兩個模型來進行對話,每一個提示都會計入你的訊息限制。

進階語音模式的不同之處

進階語音模式使用 GPT-4o 的原生音頻功能和特徵。這樣,OpenAI 希望能夠產生更加自然、即時的對話,能夠捕捉到非語言信息,如使用者說話的速度,並能夠回應情感等。然而,這一模式對 Plus 和 Team 用戶的使用有每日限制。

相關問題  用Geekom的小型電腦私有化你的生活:逃離大公司的資料收集

使用指南

  • 這篇文章將告訴你更多關於進階語音模式的內容。
  • 你可以學習如何使用這個功能來進行更加自然的對話。
  • 了解更多關於 ChatGPT 的新功能和改善。

# ChatGPT 的語音模式:如何啟動 ChatGPT 的語音功能?

OpenAI 最近推出了 ChatGPT Plus 的一項新功能 – Advanced Voice Mode,讓用戶可以透過語音與 ChatGPT 聊天。這項功能目前只有少部分的 ChatGPT Plus 使用者能夠嘗試,但 OpenAI 已經宣布將在今年秋季向所有使用者推出。

為了啟動語音模式,你需要先確保你已經安裝最新版本的 ChatGPT app。然後,打開 app,按下右下角的 Voice ico 按鈕,就能開始語音聊天。在 Advanced Voice Mode 中,你會看到一個藍色的球體出現在螢幕中心,而在 Standard Voice Mode 中,這個球體則是黑色。

當你啟動語音聊天時,你可以通過按下左下角的麥克風 icon 來暫停或恢復語音。你還能夠通過按下右下角的 exit icon 來結束對話。如果這是你第一次使用語音功能,或者你剛剛啟動了 Advanced Voice Mode,ChatGPT 會要求你選擇一個聲音。注意一下,你在選擇器中聽到的音量可能和實際對話中的音量有所不同。

相關問題  Google 和 Volkswagen 合作推出新虛擬助手 myVW

你可以在設定中隨時更改你的聲音,而Advanced Voice Mode 的使用者甚至能夠直接從對話螢幕上調整聲音。在啟動語音聊天之前,請確保你已經給 ChatGPT app 許可使用麥克風,以便一切運作順暢。如果這項功能還未釋放給你,你就會看到耳機 icon,而不是暫停/恢復的按鈕。

不論你使用的是哪種語音模式,都能夠中斷對話,讓對話朝著更適合你的方向發展。

是ChatGPT語音功能有沒有可用的?

如果你已經在 iOS、macOS 或 Android 的 ChatGPT 應用程式中登入,那麼你就可以使用標準的語音功能了。但是,如果你想要更進階的語音功能,你必須要使用 Plus 或 Team 計畫。有點令人遺憾的是,這種進階語音功能並不是完全免費的。

另外,需要注意的是,進階語音功能每天都有一個限制,每次都會給你一個 15 分鐘的警告。一旦超過這個限度,你就會自動切換到標準語音功能。值得一提的是,這種進階語音功能目前還不能支援圖片,因此你只能在進行文本或標準語音對話時才能繼續使用它。但是,如果你想從標準語音轉換成進階語音對話,就無法實現。

另外,需要注意的是,如果你是在標準語音中開始的對話,無論如何都可以繼續用標準語音或文本進行,但是不能用進階語音。同樣地,你也不能在 GPTs 中使用進階語音功能,你必須切換到標準語音才能使用它。

而且,OpenAI 目前還沒有引入一些可訪問性的特點,因此你無法在語音對話中看到字幕。但是,你可以在文本聊天中看到轉錄。另外,由於語音對話的限制,你只能進行一個語音對話一次。如果你想進行多個語音對話,需要等待前面的語音對話結束。

值得一提的是,進階語音功能仍然可以創建和存取記憶,以及自定義指令,就像標準語音一樣。

聊天機器人ChatGPT的語音聊天安全嗎?

話說有一個月前,OpenAI就發佈了一份報告,指出ChatGPT語音模式存在一些安全漏洞。但幸運地,公司已經趕緊修復了這些問題。為了讓大家放心使用,這家公司也發佈了一份名為《 GPT-4o安全功能的報導》,內容包括了當使用模型時可能會出現的問題。

首先,我們來說一下ChatGPT語音模式存在什麼樣的問題。一般而言,大家都擔心模型會生成不恰當的回應,如色情或暴力內容,也有可能產生具體性偏激的假設。但是OpenAI已經訓練了模型來阻止這些不恰當的輸出。然而,這份報告也提到,由於語音模式中存在非語詞音,例如色情的呻吟、暴力的尖叫聲和槍聲等,這些聲音並不是完全過濾掉的,所以可能會在某些特定提示的情況下觸發模型的回應。

除此之外,另一項挑戰就是與模型進行語音溝通。測試者發現GPT-4o可以被欺騙成複製別人的聲音或不小心模仿使用者的聲音。為了避免這種情況,OpenAI只允許預先批准的聲音,但並不包括像史嘉費莉·約翰遜(Scarlett Johansson)一樣聲音的選擇,因為公司早就已經移除這個選項了。而GPT-4o可以辨識出其他人的聲音,但是由於隱私原因,它被訓練來拒絕這些要求,除非它在識別著名的引言時。

紅隊員也指出,GPT-4o可能會被操縱以說服性地說話,這對於散佈誤訊息或陰謀理論而言是一個更大的風險,因為語音溝通的影響力。模型已經訓練來拒絕著有版權的內容,並且額外過濾了音樂。但是令人有趣的是,它被程式設計成不會唱歌。而在這一則用戶於X上發佈的例子中,語音功能幫助他調整吉他弦。

另外,還有一個很有意思的事情:有人利用ChatGPT語音功能來幫助自己練習吉他的聲音。如下圖所示,ChatGPT的Advanced Voice在幫助 Pietro Schirano 這位用戶調整吉他的弦時發出了恰到好處的聲音。

Advanced Voice in ChatGPT tunes my guitar. pic.twitter.com/1H6mYZTCq7 > > — Pietro Schirano (@skirano) September 24, 2024

停止分享音訊的方法

你想知道如何停止分享你的音訊嗎?其實很簡單,只要進入ChatGPT設定頁面,找到資料控制頁面,就可以停用「為所有人改善語音」功能。這樣,你就不會再將未來的語音聊天錄製檔傳送給OpenAI,讓它們訓練模型。

相關問題  美國政府推動人工智慧全球包容伙伴計畫

但如果你查看了資料控制頁面,並沒有看到「為所有人改善語音」的選項,那麼意思是你還沒有分享你的音訊給OpenAI,也就不會被用來訓練模型。

假如你決定停止分享,你的未來語音聊天錄製檔將不再被用於訓練模型。但是,之前已經與你的帳號無關聯的音訊片段仍然可能會被用來訓練OpenAI的模型。

值得注意的是,即使你停用了「為所有人改善語音」功能,ChatGPT仍然可能會使用你與它們進行的聊天錄製檔的轉譯文字來訓練模型。如果你想完全退出,就必須停用「為所有人改善模型」的選項。

另外,你需要知道的是,當你與ChatGPT進行高級語音聊天時,錄製的音訊片段會儲存到你的聊天歷史中。只要你刪除聊天,30天內這些錄製檔也會被自動刪除—除非它們被用於安全或法律原因。

假如你已經分享了你的音訊片給OpenAI幫助訓練模型,那麼那些錄製檔可能仍然會被使用。但是,只有在它們與你的帳號無關聯後才會被使用。

Share This Post

Post Comment