Viết cho hacker không mua bullshit
Viết cho hacker không mua bullshit
Lời bài hát: Dr
Lần gần đây sóng whitepapers “Agent AI” và bài đăng LinkedIn lànot a technical breakthroughNhưng arebranding stuntNhững tài liệu này không phải là blueprints.corporate image management PDFsĂn mặc như sự đổi mới
Những gì được tiếp thị như là "thiết kế đại lý" thường chỉ làLLMs in a loop, với trạng thái không, không tự chủ, và không bảo đảm. cái gọi là "chương trình điều hành" từ PwC là một ví dụ điển hình của xu hướng này.
Những gì họ tuyên bố
Agentic AI cho phép phối hợp đa phương thức, tự chủ, lý luận hướng tới mục tiêu và chuyển đổi kinh doanh trên tất cả các lĩnh vực.
Agentic AI cho phép phối hợp đa phương thức, tự chủ, lý luận hướng tới mục tiêu và chuyển đổi kinh doanh trên tất cả các lĩnh vực.
Ăn cháo bông: Có, chúng ta hãy phá vỡ nó.
Khả năng giả định:
- Tự trị
- Tương tác Multimodal
- Hành vi nhắm mục tiêu
- Workflow Orchestra
- Học tập và thích ứng
- Inter-agent hợp tác
Nghe có vẻ như thời đại, phải không?
Những gì họ thực sự thể hiện
Không phải là một kiến trúc duy nhất, không phải là một biểu đồ dòng chảy duy nhất, không phải là một hệ thống đại lý mã nguồn mở duy nhất với bộ nhớ, ý định và trạng thái dài hạn.
Không phải là một kiến trúc duy nhất, không phải là một biểu đồ dòng chảy duy nhất, không phải là một hệ thống đại lý mã nguồn mở duy nhất với bộ nhớ, ý định và trạng thái dài hạn.
Tất cả những gì họ có là:
- Mô tả các hệ thống ML hiện có (Siemens predictive maintenance, Amazon recommendations, JPMorgan NLP doc analysis)
- Loosely tái đóng gói như “agent”
- Không đánh giá Metrics
- Không có dữ liệu benchmark
- Không tái tạo
Chứng minh kỹ thuật:
Mỗi nghiên cứu trường hợp trong tài liệu - từ Siemens đến Netflix - dựa trên:
- Traditional Supervised Learning (Học truyền thống được giám sát)
- Một số RAG (Retrieval Augmented Generation)
- Không có sự tự chủ thực sự của đại lý hoặc lập kế hoạch chạy thời gian
- Không có lý luận mục tiêu thời gian thực hoặc điều chỉnh meta-level
Agent = Wrapper xung quanh GPT
Nếu bạn đã sử dụng:
- xe gpt
- béo
- LangGraph
- xe ô tô
- phi hành đoàn
Sau đó bạn biết: họ là tất cảexecution loopsvới các cuộc gọi GPT, chức năng kích hoạt, và một bối cảnh JSON.Họ không thông minh.Họ là mỏng manh và tĩnh.
Không có công cụ nào hỗ trợ:
- Ký ức Episodic
- Mục tiêu đàm phán
- Cross-Agent Dynamic Delegation Thành viên
- Lập kế hoạch thích ứng với các đầu vào chưa biết
Tại sao điều này xảy ra
Đây chỉ làAI’s Instagram moment- Thay vì selfie, bây giờ chúng tôi đăng PDF với biểu đồ mũi tên chỉ vào từ "chủ nhân".
Khuyến khích doanh nghiệp:
- Các hội đồng quản trị cần chứng minh rằng họ không quá muộn với AI.
- Các giám đốc điều hành cần các giao dịch trông giống như "chiến lược".
- Các nhà tư vấn cần bán dịch vụ chuyển đổi.
Nhập: 40 trang PDF với các cụm từ như “từ copilot đến autopilot” và “service-as-a-software”.
thực tế check
“Agent AI” vào năm 2024 =
for (const step of task) {
const reply = await gpt(prompt + history);
if (reply.includes('search')) callSearchAPI();
}
- Đúng vậy, đó chính là nhân viên.
Những gì cần tồn tại (Nhưng chưa có)
Một hệ thống đại lý thực sự sẽ yêu cầu:
- Bộ nhớ: Episodic, semantic, vectorized
- Lập kế hoạch: phá vỡ mục tiêu trừu tượng và lên kế hoạch lại
- Meta-reasoning: Biết khi nào bạn thất bại
- Không gian hành động: Điều khiển API, công cụ, dịch vụ
- Lời bài hát: Environmental Sensing, Consequences
- Tự chủ: Hoạt động mà không có kịch bản hoặc người dùng trẻ sơ sinh
Không có gì trong số này có mặt trong bất kỳ “AI đại lý” nào được tiếp thị công khai.
Kết luận
Gọi các gói LLM hiện tại là “các đại lý” giống như gọi các macro Excel là một cuộc cách mạng trong ngôn ngữ lập trình.
Real agents are still an R&D dream. What you see on LinkedIn is marketing cosplay.
Các hacker cẩn thận:don’t fall for the .pdf industrial complex.
Bonus
Nếu nó không có trí nhớ, lập kế hoạch hoặc không gian hành động độc lập - nó không phải là một đại lý.
Nếu nó không có trí nhớ, lập kế hoạch hoặc không gian hành động độc lập - nó không phải là một đại lý.