Communeify
Posts
電子報-002

電子報-002

2025-04-14

JH LAI
April 14, 2025

_Communeify

電子報-002

2025年4月14日

ByteDance 推出 Multi-SWE-bench

ByteDance 的多語言程式碼修復基準 Multi-SWE-bench 來了！看看它如何幫助大型語言模型更聰明地解決真實世界的開發難題。你可以透過基準評測找尋哪種語言模型更適合哪種程式碼。當然這個評測更適合查找SLM或是量化開源模型而不是主流閉源模型(否則編碼一律都使用Claude sonnet)。

閱讀更多 →

Google 重磅發布 69 頁提示工程聖經

雖然提示詞在思考模式下已經沒有很重要去學習，但是若你想寫出更準確的提示詞，你仍然需要這些能力。而Google發布了一份足足有 69 頁的白皮書，專門探討「提示工程」。如果你很愛買教學建議先讀完。可以直接透過此連結 Google Prompt Engineering White Paper on Kaggle 前往。

閱讀更多 →

OpenRouter的Optimus Alpha

由於上一期推薦的 Quasar Alpha ，雖然在網頁很早就發布了，但因為電子報比較晚，導致隔一天就下架了，所以在此順便續接 Optimus Alpha 。注意該模型是用來測試的，不要使用於有關隱私的訊息使用。

ChatGPT 推出記憶功能

OpenAI 為 ChatGPT Plus/Pro 用戶悄悄推出「記憶」功能，讓 AI 不再健忘，能記住你的偏好，提供更個人化的互動。跟舊版的差別是他會自動處理而不是主動要求。但其實市面上也有很多記憶平台可以記憶，例如: mem0，可以用於不同平台的語言模型。不太懂為何Sam Altman會說睡不著覺。

閱讀更多 →

a few times a year i wake up early and can't fall back asleep because we are launching a new feature ive been so excited about for so long.
today is one of those days!
— Sam Altman (@sama)
2:09 PM • Apr 10, 2025

介紹GPT-4.5的開發歷程與突破

主要介紹GPT-4.5的開發歷程與突破，其他內容大概是說，GPT-4.5的性能超過GPT-4(順便提GPT-4要退休了，將以GPT-4o全面取代)，獲得使用者好評。開發團隊包括資料處理、系統架構與演算法專家，合作克服了系統擴充與訓練過程中的挑戰。隨者規模變大，資料效率與系統設計變得越來越重要。未來將持續探索有效的演算法與訓練方式推動AI發展。

最後，如果有看到的話，每週一和週四會送出。若是上週四到當週一沒有什麼新消息，則不會送出。