- Communeify
- Posts
- 電子報-004
電子報-004
2025-04-24
Communeify
電子報-004
2025年4月24日
OpenAI 手把手教你打造專屬 AI 代理人
Nari Labs Dia 模型:聽見未來?超逼真 AI 對話生成技術登場!
FramePack 如何讓圖片轉影片像玩圖一樣簡單
覺得 AI 影片生成又酷又炫,但硬體門檻高、生成時間長? lllyasviel 推出的 FramePack 可能就是你的救星!這款新工具讓影片擴散模型的感覺就像在玩圖像擴散一樣,甚至可能在你的筆記型電腦 GPU(VRAM 6G以上,Nvidia 30/40/50系列) 上就能跑。來看看它是怎麼做到的!
實測大概要多生成幾次才能得到滿意的結果,算是一個好玩的玩具。
跟 ChatGPT 說「請、謝謝」太浪費電?
你跟 AI 聊天會用禮貌用語嗎?OpenAI CEO Sam Altman 最近表示,對 ChatGPT 說「請」和「謝謝」其實是在浪費運算資源和電力。這番言論引發熱議,究竟我們該如何看待與 AI 的互動?效率和禮貌,哪個更重要?
Grok-3 Mini 震撼登場:CP 值爆表!xAI 要用平價 AI 顛覆市場?
| Gemini 2.5 Flash Thinking | o4-mini high | DeepSeek R1 | Claude 3.7 Sonnet Thinking | |
---|---|---|---|---|---|
Price | $0.30 / $0.50 | $0.15 / $3.50 | $1.10 / $4.40 | $0.55 / $2.19 | $3.00 / $15.00 |
是很便宜,但我被Grok 2 傷害過。
Google 新武器 Gemini 2.5 Flash 來了!更快、更聰明,還能讓你控制「思考」
Google 最新發表的 Gemini 2.5 Flash 不僅速度飛快,更導入創新的「可控思考」功能,讓開發者能在效能、成本和速度間找到完美平衡點。一起來看看這個 AI 新星到底有什麼厲害之處!
簡單的說就是2.5 Flash可以決定要不要開啟思考的功能,在Google AI studio的價格比原先的2.0價格較高(但Vertex AI Gemini 2.0的價格一樣,語音輸入則從0.75調整到1美元,企業組織怎樣都會直接替換2.5),思考輸出為3.5美元,對標的應該是o4 mini才訂出這個價格。至於聰不聰明,我覺得思考大致上都這樣了,由於評測幾乎沒有測試不開啟思考的時候,所以也不知道該說什麼好。
OpenAI正式正是推出API 名為 gpt-image-1
由 ChatGPT 廣受歡迎的圖片生成技術驅動,最新的 gpt-image-1
模型現已透過 API 開放。
開發者和企業現在可以輕鬆地將高品質、專業級的圖片生成功能直接整合到自己的工具和平台中。這個模型支援多種風格,能準確遵循指令並渲染文字,開啟了跨領域的無數實用應用可能。
價格方面,採用基於 token 的計費方式,生成一張高品質圖片的成本相當具競爭力 (依品質和尺寸約為 $0.02 到 $0.19 美元),價格如果跟聘用人員來說相當便宜,當然相對於Flux等產品來說偏貴。
他給的範例大多以修圖為主,簡單說以前可能其他產品訂閱制才能使用的調整圖片的API,現在可以直接用OpenAI API就可以達到,而開源產品也可以透過套API的方式提供更便利的修圖。
提供給各位一點中文字的優化,你可以給font,但其實更方便的是產生圖片後,將它產生的文字用Canva或者小畫家或者你喜歡的設計軟體(PS、Krita等),重新編輯新的文字後,再請AI結合即可,或是在產圖前先提供產生文字的範本。目前大多產品接受局部變動都可以用這個方式。
其他
SkyReels-V2 讓無限長度電影成真! ,相對於先前介紹的FramePack,這個比較專業,比較需要資源。
Claude Code:代理程式編碼的最佳實踐,Anthropic 提供的大量新文檔,介紹如何從其Claude Code CLI 編碼代理工具中獲得最佳結果。
MCP安全檢查表,這邊提供了一系列列表提供你使用MCP需要了解的事項。