電子報-006

2025-05-22

Communeify

電子報-006

2025年5月22日

Google I/O 大會

這個我想如果有關注的,應該都看了很多相關訊息了。簡單分成吹噓一下Gemini 2.5 Pro多麼厲害、Google Meet即將推出即時翻譯功能(不是逐字稿,而是能對照說話者語氣以及音色轉成聲音輸出,目前提供西班牙文和英文給Google AI Pro 和 Ultra用戶試用) 、Gemini 2.5模型的更新、Gemini Advanced 更新、AI搜索(會在你搜尋的頁面提供AI overviews)、AI Mode就是搜尋的agent可以提供虛擬試穿、AI購物推薦(根據搜尋的產品,當特價時會通知你)等功能,推出具備原生語音的Veo 3和圖像生成模型Imagen 4以及Flow、開發工具Jules、Android XR,順便把以前沒做成功的項目改名並整合AI推出等。閱讀更多可以前往他的Blog查看更多消息。以上大多先從美國開始試用。

Microsoft Build 2025

以下只提供一些相關訊息,其他請往閱讀更多查看。Windows AI Foundry 在本地運行local模型,唯一我覺得很棒的是會根據你的環境自動選擇最佳化的GPU、NPU都沒有就選擇CPU,讓建置更輕鬆、GitHub Copilot Chat Extension開源、Azure提供更多模型包含Flux、Sora等等。

Gemini Diffusion

由於他需要提交Wait list,所以我選擇跳過,不過我還是上網查了一下別人的使用影片。

Google對其評價:

“““

傳統語言模型(自迴歸模型)每次產生的一個標記或是文字,這個過程可能很慢,並且限制了輸出品質。擴散模型的工作方式不同,不是預測下一個文字,而是從一堆「雜訊」開始,然後一步一步地把這些雜訊變得越來越清晰,最後生成出你想要的內容。

這種方式讓擴散模型可以:

生成速度快:它們可以很快地嘗試不同的解決方案。 即時修正錯誤:在生成的過程中就能不斷地調整和修正。

這使得擴散模型在像編輯文字、數學問題,甚至是程式碼這類需要精確修正的任務上表現得特別出色。

“““

就像圖片一樣你可以透過多個step讓模糊的圖片越來越清晰。

他是使用Gemini 2.0 Flash lite,但是是其五倍速度,看完測試影片其實跟之前的firebase.studio差不多的想法,很快。由於沒有提供任何基準評測也無法看出他跟其他語言模型的比較。

新 Gemini 2.5

整篇有一半都是跟第一篇Google I/O 大會延伸。新增了音訊輸出,現在推出2.5 Flash/Pro的音訊輸出,你可以前往這裡測試。

新的2.5 Flash 上市gemini-2.5-flash-preview-05-20。以下是他的Benchmark,看到還是要抱怨一下評測都是以思考版為主到底為何還是要寫非思考的輸出價格。

另外2.5 Pro會推出深度思考的功能(但尚未實裝API)

Gemma 3n

本來其實對小模型興致缺缺,但我試用了Qwen3 4B和Gemma 3 4B後(為何選擇4B因為量化4bit、5bit大概3G就能跑,加載速度也快)。我覺得Gemma 3 4B用來翻譯挺不錯的,我想應該不會有人用4B去寫程式吧。而推出的3n主要是部屬在手機上為主的。若嫌本地部屬太麻煩的也可以到ai.dev,可以選擇Gemma 3和Gemma 3n試用。Gemma 3n 主要以多媒體輸入、即時轉錄語音、5B模型僅需2G即可運行、Google colab即可微調等。我使用3.14GB(E2B模型)在手機上每秒大概輸出在2.94 tokens。多方面優點提供給你們。

Hugging Face免費MCP課程

課程內容簡介(以下課程內容為AI整理)

  • 第0章:準備工作 這一章會教你安裝和設定所有需要的工具和平台,讓你準備好開始上課。

  • 第1章:MCP基礎與核心概念 你會學到MCP最基本的概念、它的架構,以及它包含哪些重要部分。課程中會用一個簡單的例子來展示MCP怎麼運作。

  • 第2章:實戰應用:端到端MCP專案 這一章會帶你實際操作,從頭到尾建立一個簡單的MCP應用程式,完成後你還可以分享給其他人。

  • 第3章:進階部署:MCP在Hugging Face生態系 在這裡,你會學到怎麼把MCP應用程式部署到網路上,利用Hugging Face(一個知名的AI平台)的工具和其他合作夥伴的服務。

  • 第4章:額外單元 這是一些額外的課程內容,教你如何更好地利用MCP,以及怎麼結合其他合作夥伴的程式庫和服務。

  • 前往查看

    其實MCP服務,就是MCPServer提供端點可以sse(server sent events),本機的話就是stdio,流程就是MCPClient連線MCPServer、取得工具,將取得的工具描述(description)以及名稱(name)以及參數(args)加入到function內去呼叫。

    之所以方便就是因為提供MCPServer會回傳使用的工具,你就不必要再填寫工具的描述和參數以及工具的執行程式碼。