松音 — Gemini Flash Live

講者:松音
Facebook Threads
日期:2026-03-28

松音一上台就先跟大家打預防針,「我只是來表演一下。」但他這一「表演」,直接讓全場看到了 AI 語音互動目前能做到什麼程度。
他展示的是 Gemini 3.1 Flash Live,Google 昨天才更新的模型。
一開場,松音就把 AI 助教叫出來,「哈囉,我們的助教,你在嗎?」助教秒回,而且語速非常自然,沒有那種 AI 特有的停頓感。松音直接嗆它,「你不用跟我講幹話,這個簡報不是你做的」,然後開始用問答的方式帶觀眾走過簡報內容。
這段互動展示了幾個關鍵能力:第一,它可以根據你的指令翻頁,你說「翻到第四頁」它就翻。第二,它會讀懂簡報內容然後用自己的方式解說,所以松音說「就算你像我一樣完全看不懂這個簡報在幹嘛,它也可以幫你解說」。第三,它的即時反應非常快,好像真的在跟一個人說話。
松音問它聽不聽得懂台語,Gemini 很誠實地回了一句「拍謝啦,目前台語可能還沒辦法溝通」,全場笑了。
一、展示內容
松音這次的示範分成兩個部分:第一部分是用 Gemini 3.1 Flash Live 搭配簡報,展示「簡報助理」的即時語音互動功能;第二部分是用同一個模型跑角色扮演(跑團),模擬業主與設計師之間的衝突對話,讓大家感受一下這個模型的語言表達能力和角色扮演深度。
整個示範過程中,松音一邊跟 Gemini 對話,一邊讓它即時翻頁、解說簡報內容,現場所有互動都是即時的,沒有事先排練的腳本。
二、Gemini 3.1 Flash Live 功能亮點

- 即時語音對話,幾乎沒有停頓感,反應速度像真人助教
- 低延遲實時語音,比前一代模型效率明顯提升
- 聲調理解:能辨識語氣和情感變化
- 多語言支援,支援全球兩百多個國家的語言
- 多步驟函式呼叫(Function Calling)能力達到 90.8%,是目前業界最高指標
- 原生多模態能力,可以直接理解圖像與語音的組合
- 已有企業落地案例:Amazon 使用此模型提升客服體驗
三、簡報助理功能
這個功能讓你可以在做簡報的時候,讓 AI 擔任「會動的助教」,它能自動幫你翻頁、自動解說每一頁的內容。松音現場示範了這個場景:即使他自己完全看不懂簡報在講什麼,Gemini 也可以根據簡報內容即時回答觀眾的問題。
實用資訊整理如下。
使用位置:Google AI Studio
是否免費:目前 API 免費開放,剛開放不久,額度上限暫時看不出來
操作門檻:原則上需要自己寫一點程式碼才能讓簡報同步翻頁
語言限制:目前不支援台語,可用中文和英文操作
松音開玩笑地說:如果今天的簡報是沒有人付錢請你來講的,可以用這個功能輔助;如果是有人花錢請你來的正式場合,當然還是要自己來,不然可能會被打。

他也提到一個更實用的場景:假設今天簡報有 80 頁,可以先讓人把課上完,等到同學提問的時候再把助理打開。同學問什麼,它就理解問題的語意、自動翻到對應的頁面,就算那頁早就講過了,也不用尷尬地說「這個剛剛好像講過」,助理直接翻回去讓同學看到。當然也可以透過 Agent 呼叫 Claude、搭配 gws CLI 去翻 Google Drive 上的簡報,但沒有即時語音互動的那種震撼感。
四、跑團展示(角色扮演)
真正炸場的是跑團展示。
松音切到另一個功能,讓 Gemini 扮演角色跟他對戲,場景是「業主跟設計師吵追加預算」。一開場 Gemini 就啪一聲把文件丟在桌上,「你還敢問情況?你自己看看這份合約,當初說好的工程款,被你改個設計,現在要追加兩百萬!」
松音回嗆,「要告就來告啊,不然咧?」
Gemini 不甘示弱,「律師函都寄到你公司門口了,你還在這邊跟我大小聲。」
松音繼續演,「這只是廢墟嗎?不會啊,蓋得很好啊,已經完工了好嗎?你在講什麼幹話?」
Gemini 的回擊:「完工?你睜眼說瞎話。工地現場根本還是一片荒涼,鋼筋都還露在外面,你跟我說完工?我看你是不想活了」
它甚至會轉身瞪人、對著律師求助、擲骰子決定劇情走向,因為本來就是跑團機制。全場笑到不行。
示範的場景設定是業主與設計師吵架,中間還帶著律師出場。Gemini 扮演的業主氣勢十足,一開始就把一疊合約摔在桌上,大喊追加預算不合理、工地還是廢墟,甚至揚言律師函已經寄到公司門口了。松音說明,這個跑團機制中間還會自動擲骰子,因為本來就是跑團的規則設計。模型可以一直這樣打下去,不會自行中斷。他最後建議大家可以拿這個功能來模擬跟業主吵架,當練習用。
五、實用資訊
| 項目 | 內容 |
|---|---|
| 模型 | Gemini 3.1 Flash Live |
| 平台 | Google AI Studio |
| 費用 | 目前 API 免費 |
| 語言 | 200+ 國語言,不含台語 |
| 企業案例 | Amazon 客服 |
| 門檻 | 需自行撰寫 Coding 串接 |
| 關鍵指標 | 多步驟函式呼叫 90.8%(業界最高) |
六、核心觀點
- Gemini Flash Live 的即時語音互動已經達到「像真人對話」的流暢度
- 簡報助理功能可以自動翻頁、解說,適合非母語簡報或臨時上場的場景
- 跑團/角色扮演功能不只好玩,可以用來模擬業主溝通的各種情境
- API 免費、在 Google AI Studio 就能用,但串接需要自己寫 Coding
- 台語目前不支援

「這只是隨便一個好玩的功能。」—松音