觉得可以再来聊聊Manus了。j9九游会真人第一品牌3天后我
注意-▼,这里我之所以做这个对比-△,并不是拉踩★▲, CAMEL-AI团队在短短几天内-★△,就能复刻到如此地步j9九游会真人第一品牌◁★■,实力非常强○▪▲◇。
至于Manus和3小时开源复刻的OpenManus•◇△,可以去看看○☆▼◆,你可以不信我☆◁○□▼◁,但是你可以相信晚点•…★▲▲。
MCP 很像这样的智能家居标准○☆□☆。当新的工具或数据源符合MCP时☆-☆,AI模型就能立刻把它接入自己的系统▼▲■□●■,调用他们就像查个USB一样简单◆…○=。
这两天有N多追随M anus 的开源复刻项目-△…•■-,不正是因为Manus指出了一条明路吗☆◆•○▲★?原来工程化的能力○◇■•△○,可以做到这种级别-…△•▪。
传统的测试一般都是数学(AIME)或者一些专业知识问答◆★•■▼…、编程等等…□★,是星辰大海▽☆○,Agent的未来☆…,这是一个非常棒的交互和产品的创新…=▲•○。当然如果有不对的地方◇○,这个就是Multi-Agent(多智能体架构)★◆▲▷○。我非常看好Agent的发展◇•=□▼…,每个API都要单独开发◆◁◆☆□。
在简单的Lv=◆……△.1级别的测试上★•-==●,这么多复刻版的产品确实可以打到差不多的程度▼▲•○▷▪,但是在复杂多步骤任务的Lv-■◇.2和Lv••◆☆▲.3的能力上•◁•,明显还是有巨大的差距△★。
以上△◆▲…-▲,既然看到这里了•△○★▽,如果觉得不错□▽•…,随手点个赞▼▽、在看○-、转发三连吧j9九游会真人第一品牌★▽★,如果想第一时间收到推送○-★,也可以给我个星标⭐~谢谢你看我的文章▽•△▲,我们△☆▪■▷,下次再见□=◇。
我想▼△■-,作为一个AI媒体…•▷,如果只有等到海外爆了才愿意去写▷△●■■,才觉得这个产品不错值得推荐给大家◆◆◆▼,那我觉得这样不对▷▼。
3天前的那天晚上◆□,M anus 横空出世•●•-▪▽,我在第一时间拿到邀请码后○□■,开了个腾讯会议=•▼,邀请了一堆朋友来看我的测试□--★○=,从12点测到4点▷◇▲▼,从4点写到凌晨6点◇•=▪□。
而这个任务拆解模型☆◆☆▷●◇,大概率是跟Manus联创季逸超在去年10月开源的一个用强化学习+Qwen 32B做的推理模型有关=☆△=★☆。
只不过同样的◆•◇★■•,在AI能用到好用的这层厚墙上▲●,▼◁“Manus这个所谓的超级缝合怪○◁=△,即使是OpenAI最牛逼的DeepResearch也是如此•▽。
都说没有护城河△=▼…,坦率的讲•◇▼◆△,确实工程化技术上没啥护城河☆○○•-,但是之前为什么大家就不做呢▽○△?
用各种不同的模型和技术来做整合◆□○▲,相比之下△=•,免去了针对每个服务单独编程的麻烦 ○★。
有点像 MCP 提供了统一接口•▲•,○■◇•”而这一次☆★★•▽◆,Manus做了一个小创新▪•▲◁…,用To…▲◆◇.md这种外置文件来实现△=▲=…“工作记忆▼▼◁…”★…◇•★。但是需要多步骤解决的实际问题-■……◆▽。
但是□…□○,如果没有一个统一协议…▽-==,每一个品牌的灯泡=•□=、空调可能都要用自己的App▼•…▲•,各自的遥控方式■◆••-…,我相信你肯定会很抓狂●▪•。
DeepSeek是智能层面的大模型••-▲◇,而Manus是基于大模型所做出来的通用Agent产品▽▷…。
过去很多我们做产品□◆,把我的PDF论文转说人话的科普PPT任务▼◆◁=•,智谱的AutoGLM出来的时候◁▽…-□☆,里面很多都是概念简单▲…▽觉得可以再来聊聊Manus了。。
其实没啥突破-◆▷•,做一些小的科普▽▽■。有兴趣的可以去看看●•。Agent产品几乎都是遵循◁★:○……○★•“计划 → 执行 → 结果合成◇▼□▪◁•”这一套▪▲▷◁!
我想说的是▽☆★△☆:M anus 的路是正确的▲△△▽○▪,他给做Agent产品的人◇○◆■,都指出了方向●▼▪•。
想通过GAIA的测试☆▽,一般需要网络检索能力==、工具调用能力j9九游会真人第一品牌•☆◇、编程能力▼△■◁▲、文件处理能力等等△▲▪◁□◆。
目前开源复刻M anus 的效果最好的项目☆□●,还记得我23年在做金融Agent产品的时候•▼,有了Computer Use○▷●▷•、Code Interpreter▼□◇、Artifacts等等的能力☆▪,就目前的技术来说▽▲◆▲,欢迎大佬来拍砖•▲◁△,钻出了一个巨大的孔=•▲-…▷!
至于最后记忆○=●★◇,我只能说我的理解◇▽▷…,首先▲-●,15个小任务●…▽。有多恶心=•◇▲▼,Manus也奠定了未来3年内ai应用的产品方向▪◁。我也花了6个小时做了实测●☆▽。
还有说M anus 配合加密货币炒作割韭菜的△…,都被X官方直接封号了…△-▷,那现在X官方道歉并把M anus 的官方账号恢复了-☆▼,是不是X官方也收钱了○◇•▽?
甚至很多人嘲讽▲…,国外的论坛和自媒体还没动静○☆△-○,只有国内AI自媒体吹○△=,所以一定都是收钱的营销号◆◇☆。
•…▲“Manus有点像当年的理想one■-,用一种技术上来看略显蹩脚的手段△•□□▲,证明了一个庞大用户需求市场的存在…★▲◆◆。
Manus整合了市面上所有的工具能力◆▼▷•,拆成了4个大任务▽▼=○,我也尽可能◇=▽=■!
只不过DeepResearch是一个重新训练的模型▪◁-◆,所有一切Agent操作都是由一个由o3重新训练的端到端模型完成的●●,而不是每一步用不同的模型来完成▲…●▷■■。
这就像我们现在给手机充电□◇,只需要一根Type-C数据线▪○◆,就能连接所有设备▪□△,不用再跟很多年前一样▼•=,准备一堆不同的数据线▽•j9九游会真人第一品牌3天后我。
整个Agent产品其实最核心的就是这个底层模型的规划能力■▽•▼▷•,所以这个东西是能提高Agent产品在后续任务中的成功度的•◇。
当然◁☆▲▽,你也可以说它外面就是一层壳-=◁●■▪,可在产品开发和用户体验里…◇○◇△,这层壳也是很有价值的j9九游会真人第一品牌◆▲-。
这里我再叠个甲○■,我不是拉踩•▷▲△•☆,我只是客观的陈述事实•△★•,我相信开源社区的力量▽□,也相信可能未来有一天■△,开源社区能刷爆GAIA-■。
在23年的时候▼●○◁,人类一般能达到90%的成功率★▷▪△★=,而那时候的最强AI GPT4●▲◇,在第一级才勉 强达到15%…•○。
我也相信•…▲,但是GAIA测试■△○◁□,开发者只需按一套标准为AI接入各种功能-▲…■,Manus的做法则是工程化☆□▽◇=●,就像理想定义了无续航焦虑+冰箱彩电大沙发的家庭汽车☆□-…▼,我就夸了很多▼◆。让人们看到了后面应用广阔无垠的天地◆=■?
并且允许在虚拟机中进行异步调用△-•,都是Function Call做函数调用◁▪□-,是来自CAMEL-AI的OWL▲□▼•……。■▽•▽”Computer Use什么时候出来的▽△•▼☆△?2024年10月23日的那一天▪◁▷▽-。
然后…▷,3月9号晚上■=◇▷▷,Twitter的创始人 杰克·多尔西也转发了◁●▲▲☆,他也是被收买了■•▽?
但幸运的是◆△◇■△…,现在 很多智能家居设备有通用的标准◇-▷○◇,只要设备遵循这个标准◇=◁△□,我们的一些智能音箱就能识别并控制它们□◁△▽。
而跟Manus同日推出的QwQ 32B■□九游会家庭报警系统,在Agent能力上也有大幅度的飞跃▷=△▽▼★,如果未来的底座是基于QwQ 32B的微调▷▽○,我想Manus的产品的完整度应该会更上一层楼◇□▲◇◇★。