訂閱電子報
第一屆同學會  ·  2026-03-30

松音 — Gemini Flash Live

松音 — Gemini Flash Live

講者:松音
Facebook Threads
日期:2026-03-28


Gemini 3.1 Flash Live 簡報封面
Gemini 3.1 Flash Live 簡報封面

松音一上台就先跟大家打預防針,「我只是來表演一下。」但他這一「表演」,直接讓全場看到了 AI 語音互動目前能做到什麼程度。

他展示的是 Gemini 3.1 Flash Live,Google 昨天才更新的模型。

一開場,松音就把 AI 助教叫出來,「哈囉,我們的助教,你在嗎?」助教秒回,而且語速非常自然,沒有那種 AI 特有的停頓感。松音直接嗆它,「你不用跟我講幹話,這個簡報不是你做的」,然後開始用問答的方式帶觀眾走過簡報內容。

這段互動展示了幾個關鍵能力:第一,它可以根據你的指令翻頁,你說「翻到第四頁」它就翻。第二,它會讀懂簡報內容然後用自己的方式解說,所以松音說「就算你像我一樣完全看不懂這個簡報在幹嘛,它也可以幫你解說」。第三,它的即時反應非常快,好像真的在跟一個人說話。

松音問它聽不聽得懂台語,Gemini 很誠實地回了一句「拍謝啦,目前台語可能還沒辦法溝通」,全場笑了。


一、展示內容

松音這次的示範分成兩個部分:第一部分是用 Gemini 3.1 Flash Live 搭配簡報,展示「簡報助理」的即時語音互動功能;第二部分是用同一個模型跑角色扮演(跑團),模擬業主與設計師之間的衝突對話,讓大家感受一下這個模型的語言表達能力和角色扮演深度。

整個示範過程中,松音一邊跟 Gemini 對話,一邊讓它即時翻頁、解說簡報內容,現場所有互動都是即時的,沒有事先排練的腳本。


二、Gemini 3.1 Flash Live 功能亮點

Gemini 3.1 Flash Live 核心能力一覽
Gemini 3.1 Flash Live 核心能力一覽
  • 即時語音對話,幾乎沒有停頓感,反應速度像真人助教
  • 低延遲實時語音,比前一代模型效率明顯提升
  • 聲調理解:能辨識語氣和情感變化
  • 多語言支援,支援全球兩百多個國家的語言
  • 多步驟函式呼叫(Function Calling)能力達到 90.8%,是目前業界最高指標
  • 原生多模態能力,可以直接理解圖像與語音的組合
  • 已有企業落地案例:Amazon 使用此模型提升客服體驗

三、簡報助理功能

這個功能讓你可以在做簡報的時候,讓 AI 擔任「會動的助教」,它能自動幫你翻頁、自動解說每一頁的內容。松音現場示範了這個場景:即使他自己完全看不懂簡報在講什麼,Gemini 也可以根據簡報內容即時回答觀眾的問題。

實用資訊整理如下。

使用位置:Google AI Studio

是否免費:目前 API 免費開放,剛開放不久,額度上限暫時看不出來

操作門檻:原則上需要自己寫一點程式碼才能讓簡報同步翻頁

語言限制:目前不支援台語,可用中文和英文操作

松音開玩笑地說:如果今天的簡報是沒有人付錢請你來講的,可以用這個功能輔助;如果是有人花錢請你來的正式場合,當然還是要自己來,不然可能會被打。

企業應用案例與使用場景
企業應用案例與使用場景

他也提到一個更實用的場景:假設今天簡報有 80 頁,可以先讓人把課上完,等到同學提問的時候再把助理打開。同學問什麼,它就理解問題的語意、自動翻到對應的頁面,就算那頁早就講過了,也不用尷尬地說「這個剛剛好像講過」,助理直接翻回去讓同學看到。當然也可以透過 Agent 呼叫 Claude、搭配 gws CLI 去翻 Google Drive 上的簡報,但沒有即時語音互動的那種震撼感。


四、跑團展示(角色扮演)

真正炸場的是跑團展示。

松音切到另一個功能,讓 Gemini 扮演角色跟他對戲,場景是「業主跟設計師吵追加預算」。一開場 Gemini 就啪一聲把文件丟在桌上,「你還敢問情況?你自己看看這份合約,當初說好的工程款,被你改個設計,現在要追加兩百萬!」

松音回嗆,「要告就來告啊,不然咧?」

Gemini 不甘示弱,「律師函都寄到你公司門口了,你還在這邊跟我大小聲。」

松音繼續演,「這只是廢墟嗎?不會啊,蓋得很好啊,已經完工了好嗎?你在講什麼幹話?」

Gemini 的回擊:「完工?你睜眼說瞎話。工地現場根本還是一片荒涼,鋼筋都還露在外面,你跟我說完工?我看你是不想活了」

它甚至會轉身瞪人、對著律師求助、擲骰子決定劇情走向,因為本來就是跑團機制。全場笑到不行。

示範的場景設定是業主與設計師吵架,中間還帶著律師出場。Gemini 扮演的業主氣勢十足,一開始就把一疊合約摔在桌上,大喊追加預算不合理、工地還是廢墟,甚至揚言律師函已經寄到公司門口了。松音說明,這個跑團機制中間還會自動擲骰子,因為本來就是跑團的規則設計。模型可以一直這樣打下去,不會自行中斷。他最後建議大家可以拿這個功能來模擬跟業主吵架,當練習用。


五、實用資訊

項目內容
模型Gemini 3.1 Flash Live
平台Google AI Studio
費用目前 API 免費
語言200+ 國語言,不含台語
企業案例Amazon 客服
門檻需自行撰寫 Coding 串接
關鍵指標多步驟函式呼叫 90.8%(業界最高)

六、核心觀點

  • Gemini Flash Live 的即時語音互動已經達到「像真人對話」的流暢度
  • 簡報助理功能可以自動翻頁、解說,適合非母語簡報或臨時上場的場景
  • 跑團/角色扮演功能不只好玩,可以用來模擬業主溝通的各種情境
  • API 免費、在 Google AI Studio 就能用,但串接需要自己寫 Coding
  • 台語目前不支援

立即體驗 Gemini 3.1 Flash Live
立即體驗 Gemini 3.1 Flash Live
「這只是隨便一個好玩的功能。」—松音
電子報

還有更多設計師的 AI 實驗

演算法常常將我淹沒,若想收到我的訊息,記得按下訂閱,讓下一篇電子報直接送到你的信箱。

免費訂閱