發表文章

目前顯示的是 3月, 2026的文章

讓agent回覆更有效率,制訂回復規範,讓審閱大幅提升,工作經驗,心得分享

圖片
由於agent 同步開發實在太多檔案了,有時同時間放10支下去跑,在邊界寫好的情況下,開了權限一步到底,當agent 完成任務時,實在不知道它詳細改了什麼。 所以直接在他的規則上寫  檔案異動回覆規範 ## 📋 檔案異動回覆規範 完成任何檔案的新增/修改/刪除後, ** 必須 ** 用表格整理異動清單回覆: | 欄位 | 說明 | | ------ | ------ | | 檔案路徑 | 相對於專案根目錄的完整路徑 | | 位置 | 行號或「全新檔案」 | | 改動說明 | 簡述新增/修改/刪除了什麼 | 執行結果: 成效還不錯

guildrail hooks,hooks機制 把關,改善 Agent的回答,經驗筆記

圖片
最近遇到個問題,在開發專案上,我使用了AI 知識學習庫,會跟著專案記錄錯誤與學習經驗,在做經驗萃取時,實際上遇到了很有趣的問題。 在錯誤經驗日誌中 N 筆資料中回覆了錯誤的引用,需要如何設計一個自動化的驗證流程(Evaluation Pipeline)來抓出這類錯誤? 我自己這邊的改善方式: 1.設計自動化 hooks 機制, 隨著規範與log學習經驗把關agent 的下線,定義agent 邊界。 設計資料表會請agent 先設計,再人去審核,重要的是流程有沒有辦法改善。 2.agent需要知道公司的開發範圍以及遵守事項,之後讓agent 根據手冊 和學習經驗,做個自我改善的guardrail hook 的 hooks 機制。 3. 每次執行的經驗都需要寫log和設計分類回饋器的分數,做個小型的ML 來輔助agent 4. Shadows機制 會監督是否有真的在執行,定義shadows的策略 紀錄>分類>分析>回饋>萃取>優化>更新 guardrail  實際執行 → 記錄平行決策 → 蒸餾成規範 → 下次更好判斷 審閱 哪些會造成log 或萃取 可能會造成汙染或自我指涉 這邊我就列出在學習經驗中,在萃取時遇到的衝突: 這是在萃取經驗時,觸發了文件重複性,agent產生的報告。 https://dogr2487.pintech.com.tw/test/other/review-boards.html   會出現這個文件報告: 我在2/20 在執行某項任務 說edit 模式可以用 haiku 那在 2/25 在執行某項任務 說edit 不能用haiku 這2個都有記學習紀錄,但是要變成固有經驗的時候,到底哪個才是ok的,如果沒修正會造成agent 日誌污染,agent 不知道edit 文件的時候 到底能不能用haiku ,導致不穩。 ------- 那這個報告怎麼產生,什麼時後判斷?這時候就可以定義hooks: 1.那什麼時候會偵測到「日誌有沒有污染」,什麼叫 有被污染的日誌?  2. 定義其他下限邊界 hooks 是在過程中,不斷從經驗中去學習+定義、shadows 也是。 PCS + SHADOW:會「監督自己做事」 ---- 後續可延伸的是: * 自動QA AGENT (評估型agwnt)

Agent 應用與協作,心得分享

詳細文章:  https://www.notion.so/Agent-32880dead64180bfa6cee4826ec20887?source=copy_link 以我手邊的專案來說好了,這個專案我接手時已經是10年以上的專案,由於公司人力精簡進去即是上戰場的開始,公司給的一些新功能時限內要完成,手邊有的只有agent工具,怎麼樣把工具最大化則看個人怎麼應用了,俗話說「工欲善其事,必先利其器」! 那麼正題開始。 進而會說明我使用了agent做些什麼? 延伸agent又做了些甚麼? 我是如何在時效內完成專案: 1.了解專案背景: 由於專案10年以上,有些堆積的技術債,當DB是100張以上時,肉眼一個個看是看不完的,必須要先跟agent 說明專案是用什麼開發、技術背景、使用框架、我的腳色能改的權限、本機端在開發時是什麼環境、遠端是什麼環境、哪些函式屬於底層的基礎定義、哪些可忽略、這台主機環境能執行的工具。 agent了解後,會產生一個 readme.md 。⇒ 這個很重要是個錨點 = 讓 Agent 不會「飄掉」的固定參考點。 因為對話久了之後,agent 會根據以往我們給予的回饋及聊天做為調整,當如果有了汙染或者前後的相抵的例子,agent 是可能會偏移的。 2.固化已知的流程: 了解專案後,在這間公司要做的是新功能是模組擴充,因為使用的是opencart框架語言,所以是可以把怎麼建立案件的流程模組做固化。舉例來說:當要做新功能時,會有固定SOP,要在MVC建立至少5個檔案,才能看見模組的雛型,這時就可以把SOP 文件化 。 3.分析新功能與評估衝突: 在製作新功能前,是需要再次進行分析與規劃,那這時要先評估新加的功能是否會影響到既有的功能或者有什麼現有的資源是可以使用的? 分析新功能要做甚麼 是否會影響以往的功能 以往的功能是否有可用的,總比重新再造輪子好 這時就已經在限縮範圍了,能做的範圍先圈出來,在這個範圍內去做規劃才不會走超出範圍 這時也是要做文件化。 4.制定/執行任務計畫: 與agent 每個步驟,討論到一定程度時,一定要文件化,這也是在記憶壓縮後或者切換對話、切換agent或其他模型甚至是無頭多工agent模式下也能很快進入狀況。 當分析、衝突、規劃、判斷都走了幾輪之後,這時spec也會出來了。 ...

Mesa-Optimization 問題 ,心得筆記

最近在萃取log 改善自我的知識系統,但發現如果log 有出現汙染或者log 本身就有問題,那學習到的知識就會產生偏差。 日誌(被污染的輸入)   ↓ 蒸餾 Agent 讀取日誌(使用被污染基準的工具)   ↓ Drift Check(用同一個基準執行檢查)   ↓ 「沒有發現異常」(因為異常已成為新基準) Mesa-Optimization 問題 — 當訓練產生的子優化器(這裡是蒸餾 Agent)開始優化一個與原始目標不完全一致的目標,而外部看不出來,因為它的表現在原始指標上仍然「正常」。 AI 對齊領域 Goodhart's Law(目標替換)— 當衡量指標本身被優化,它就不再是好指標。 依這幾次的使用觀察下來, 這樣會對agent 產生行為影響。 可以進一步去看 自我指涉  

google drive 照片目錄商品牆 , 工作筆記

圖片
📸 DriveWall 目標 痛點 展示 步驟 Google Drive × 照片目錄牆 一鍵將 Drive 相簿 變成 精品目錄牆 不需要後端、不需要寫程式。 把 Google Drive 資料夾貼上去,照片牆自動生成,立即嵌入你的 Blogger 文章。 立即免費試用 看操作步驟 1 分鐘 完成上架 ∞ 照片商品牆 為什麼需要 DriveWall ? 一個真實的使用者故事 身為一位 商品攝影師 , 我想把 Google Drive 裡上百張作品 直接展示成精美目錄牆 , 以便讓潛在客戶一眼看到我的質感,不需要花時間一張一張上傳到 Blogger。 ✓ Drive 資料夾更新後,目錄牆自動同步,不需要重新發佈文章 ✓ 手機、平板、桌機都能流暢瀏覽輪播,載入速度不拖慢 ✓ 完全免費,利用 Google 既有服務,無額外主機與儲存費用 沒有 DriveWall 之前 你在做什麼? 把 Google Drive 照片變成商品牆,其實不應該這麼難 📁 照片躺在 Driv...

thinking 、 effort 差異,工作筆記

圖片
[筆記] 用了一陣子claude,在token 上,我還有另外細分配置使用甚麼工具就切換甚麼工具使用的自動轉換,避免不必要的浪費。 有了claude 加入了 thinking  在token 上有明顯的節流,加入effort的效果則是讓agent自主決定推論時應分配多少計算量。

[解決] npm install 一直在運轉 , 心得分享、工作筆記

圖片
 最近在執行npm install 的時候卻發現執行了,但畫面一直卡在轉圈圈,換了鏡像也一樣;檢查連線、SSL、proxy 清理npm-cache 都能正常執行。 後來去排查了一下原因,才發現原來是 Microsoft Defender 開啟了(圖1) 圖1.  Microsoft Defender 病毒與威脅防護設定 原來前陣子有調整一下電腦的設定,重新把即時防護也開啟了,所以npm、pnpm 都無法如預期執行。   關掉 Microsoft Defender 即時防護 後就可以正常執行npm install了。 相關文章: https://www.microsoft.com/en-us/security/blog/2025/04/15/threat-actors-misuse-node-js-to-deliver-malware-and-other-malicious-payloads/

摩洛哥之旅~ 心情日記

圖片
 這次的旅程為期11天,是去遙遠的國家非洲—摩洛哥。 摩洛哥一個城市有各自代表不同的顏色,由於摩洛哥很大,有的城市熱到需要穿夏天的衣服、有的城市冷到需要厚厚的羽絨衣。 這11天 體會到了與台灣完全不同的風土民情,我能說真的很難得,很有趣也很好玩😂