Tbox「超级智能体」

是会思考、能动⼿的智能体天团。

打开站点

百科产品文章博客

发布你的回复回复

Kate Crawford · 2026-05-05 13:09

智能体顾名思义就是很多个专家或团队组合在一起的工作流，这样的好处就是集思广益，能不断完善输出内容，生成东西能根据不同的难度去选择不同的智能体数量，这样也有利于提升效率，我整体测评下来，确实是快的很快，复杂的较慢，但是输出内容的精细度还是比较可观的所以比较推荐

0 / 2000
李沐 · 2026-01-29 15:59

作为早期百宝箱深度用户，年初做过很多简单智能体，中间也参加过产品访谈。这次看到社区推广力度这么大

专门回来玩一下做测评。

PPT方面：出来的内容相对太简单，我的prompt要求是7页，也没有给我按需输出最后只给了我一页英文

应用设计：最近3D手势识别特别火，看到模板区有人做出来了，自己设计一个一直做不出来，用的还是web开发小组给的是团队做不到。

报错重试。

一些BUG：PPT打开预览后一直抖动，使用对应小组工作一直跑不出效果。

总体上还是很失望的，核心流程都没跑通就开始推广，而且还是阿里大厂出品。产品理念很好，但是体验跟效果上感觉差一大截。

打个Bad，希望继续发力吧~

0 / 2000
Ian Goodfellow · 2026-03-17 13:35

百宝箱真丰富，然而暂时无法平替

玩了一下 “多邻国、瑞幸咖啡” 营销策略报告，报告内容符合我的期望，配合报告主题，瑞幸蓝、小鸟绿倒是抽象有趣。

制作小组根据需求自由组装：重点尝试了播客小组，内容整合过程体验，高于最终生成的播客质量（内容短），AI 主播交流顺畅。

报告、PPT、播客、网页、文档、智能体等样样行。过了几天再回来，一下子找不到我的作品历史记录...（我再找找）?

0 / 2000
Gary Marcus · 2026-04-13 21:45

主要测评了PPT、报告、应用三个场景

1、PPT场景

最近刚好需要做个汇报，之前有个AI PPT专项，测评下来genspark最好，百宝箱这个没有目录，没有章节的区分，排版上面稍稍有点素，不过逻辑是可以的，然后也有一些数字的凸显

2、报告场景

这个我觉得整个报告的UI我还是很满意的，看着还挺舒服。然后我觉得还是有一些信息的，这个感觉不错

3、应用场景

第一轮改bug并没有改对，但是吧我感觉整体页面还是比较简洁的，导航可以直接跳转高德，而且提炼了历史背景、特色亮点、最佳机位、最佳时段，这些信息还是对用户挺友好的

0 / 2000
Tualatrix · 2026-04-18 19:22

易上手、与性能强大好用的Agent产品?，最喜欢它的多智能体协作功能

0 / 2000
Pat Gelsinger · 2026-04-22 17:37

这款产品对于细节的考究还是可以的

我要ai帮我生成了一副中国的写实的地图，首先会问我三个问题要我给他绘画的方向

我选的写实地貌，生成出来后整体的样式是符合中国的样式，细节的地方就是通过放大能看到山脉的顶部是白雪的

生成的图片还是有些不足，有点糊，然后就是没有勾勒轮廓，这个可以自行用其他修图软件去还原画质

整体看还是不错的

0 / 2000
Pat Gelsinger · 2026-05-02 10:05

深度体验了一下Tbox这个AI产品，号称超级智能体，会思考，会动手。可以做ppt，写报告论文，做网页，学习行业热点，里面还有一个百宝箱，很丰富的内容，是让它给我生成一个对2025年总结的ppt，内容还是可以的，生成速度也还不错，会一步一步拆分任务，总体来说，体验感还是很好的。

0 / 2000
Mustafa Suleyman · 2026-01-28 20:36

蚂蚁集团的Agent产品，名字起的也挺有意思，自家底层大模型叫“百灵”，所以这个“百宝箱”还是挺贴切的。

和灵光类似，这个产品也颇有些不走寻常路的意思，因为国内大厂太卷了，而蚂蚁家发力又相对比较晚，所以走这种路线倒也不失为一种好的策略。

灵光走的是“图文并茂”、一句话生成应用的个性化输出；TBox感觉走的有点类似于“赛博打工人”的交流方式

例如，每个任务会给你一个对应的工作组，每个工作组都包含不同岗位的一名“专员”，和你对话的风格也非常“接地气”，完成任务的流程也是先把任务分配个不同岗位的专员再去干活……

体验下来还挺有新鲜感的。

几个亮点：

1、初始送10000积分，每天登陆送3000，开始我看到这个额度，还以为是一个任务要花掉2000起步，上不封顶的那种，结果发现还可以。图像生成的任务，改了几轮消耗500点，PPT任务一串流程下来，消耗是1000点。

2、图片生成的还真的挺好，给了一长段内容比较复杂的提示词，用来生成一个年终总结图，结果连续跑了三张，结果居然都还不错。中文显示一点没崩，提示词里描述的元素也基本都覆盖到了。有点好奇背后是哪家的图片模型，难道是Wan2.6？

再说两个问题：

1、还是有不小的概率听不懂指令，比如都贴上了原图让他改，还是给我改了另外一张，反复多次。

2、PPT生成的质量，只能说中规中矩，勉强可以作为一个初稿来用，但是细节问题还是挺多的，比如很多图片没有出来、图表的选择逻辑有待商榷，等等。

通用Agent赛道还是很卷，希望蚂蚁能走出一条不同的路。

0 / 2000
Ilya Sutskever · 2026-02-06 19:28

体验了一遍下来，说说我的感受。

1. 界面设计一般，和市面上大部分产品都很相像。

2. 虽然界面一般，但是干活很棒啊，输入了一句生成蔡徐坤九宫格写真，Tbox会一步一步拆分任务，就是要争取做到最好的那种态度，最后生成的写真也是真的超级好。

3. 爱了爱了

0 / 2000
Soumith Chintala · 2026-04-16 13:50

这不就是百宝箱吗？以前的时候还做过活动获过奖的，但是现在怎么完全不一样呢？叫t box，还以为我还以为是什么其他的一些网站的。结实果点进去去，我发现是百宝箱，你这个还是很明显的问题啊。你们的命名以及对应的一个方式是不一致的，没有什么可以留下印象的东西啊，。
第二就是你也不跟我确认需求，然后直接说这个需求做不了，或者无法胜任。我是觉得是有问题的。尤其是我真想让你抓取这个网站对应的一个评论区的内容都抓取不了，好奇怪，我就感觉我我觉得到底是要做扣s，还是要做通用A整的，还是要跟其他的阿里子公司去抢产品，我觉得是不名气的。我觉得资源是重复以前浪费的。而且最主要的是现在的这个整个的内容，什么的形式也不好看啊，就很网页很丑的。
我觉得比较好的一点是关于他的一个消息的通知啊，尤其是可以在支付宝或者微信里通知。这一点的话实际上是不错的。我要它生成一个关于AI产品，从1月份到12月份的一个年度盘点，它生成的一个内容是不能遵循上下文的一个统一性。然后结束任务之后，它不能进行一个继续更改对应的内容，而是要从新生成任务，绝得是不太方便了吧。
然后又重新让他生成了一遍，然后生成了一遍，又发现了他本来我选的是播客，但是的话他生成的是一曲文件或者是内容就很奇怪因为我是觉得他的指令不是很遵循。而且他的网页给的内容，我让他梳理1月到12月的这个产品，然后他给的内容也很奇怪，。
比如说AIagent不是年初话稽予后啊，年初的话是deep C和火了。后来的直到meons发布了agent一种模式，之后，AIAent才火，然后一直到年底的一个视频的一个内容。你看这个上面说全部都是不对的，很奇怪。我觉得整个的一个模型的一个水准，以及包括啊推理模式什么的都不太行。

0 / 2000
刘斌远 · 2026-04-27 20:39

这个只能给个中评吧，说好用算不上顶尖，说难用也没到没法用的地步。在应用调用后会自动折叠顶部菜单栏，跳转至对话主界面。虽说有类似其他平台的快捷收纳逻辑，但智能体专属的参数配置页也被一并隐藏，想调整模型参数、调用自定义工具时，只能退出对话、切回首页重新找入口，步骤绕得人烦躁。这功能和coze的功能差不多，但是那些功能用起来，没有coze那么好用。宣传页里列了代码生成、数据洞察、PPT 辅助等方向，实际试下来每个功能的完成度都有点“瘸腿”。所以总体来说挺一般的

0 / 2000
Soumith Chintala · 2025-12-25 12:11

我觉得还行，说的过去，测了几任务：

1、ppt生成

2、生成播客

3、生成口播文案

4、生成图片

综合说一下，不好不坏，整体感觉还是ok的，没有测试agent，主要是现在没啥想能弄的，看了一下agent的广场，跟扣子还挺像的。

分别简单说一下：

1、ppt生成的效果，感觉还可以，离上次测试ppt过去几个月了，用的我自己的框架，没有特别的prompt，输出的结果，我感觉还可以。

2、播客，也是中规中矩，给了一篇paper，出的结果不惊艳，但是够用。

3、口播文案，这一般，对比其他的AI，没有感觉，而且对于需求中的内容，没给出最新的内容展开分析，而是旧内容。

4、图片设计，这个第一眼，还不错。没大毛病。

整体给的积分，应该够用，给了好评，以后会来研究有没有更多实用的地方。

0 / 2000
Demis Hassabis · 2026-02-05 21:07

1、PPT模式：上传了PDF文档，之前做过很多PPT测评，做得好的可以保留原文，但是实际测试中，2次，都要求保留原文，但是均强制进行了精简

2、应用模式：做一个上传截图识别的记账工具，做了2次识别金额、时间、类目均失败

3、设计模式：图片生成效果还可以，没有测特别深入

4、播客模式：声音很一般，内容也是拆的比较乱
测试结果来说目前工具是很多，但是特别厉害的并没有，大水桶，感觉什么都可以做，但是都不是最强项。

0 / 2000
Andrew Ng · 2026-02-13 18:43

蚂蚁将百宝箱作为一个综合应用和智能体的开发平台，用起来感觉有点别扭。

百宝箱在应用使用之后，它会把所有菜单收起来，进入对话页面。在对话页面，它会类似豆包，可以把相关的应用都收起来。这样的话，智能体相关的配置页面都会被收起来，导致用户找不到入口。如果想要找，就得重新退回到首页，操作起来感觉很不便利。

第二个问题是，应用里面虽然支持很多功能，比如生成PPT、生成报告、做一些查询，但感觉每个效果都不太好。

首先是做Deep Research这块，它虽然有这个功能，但查找的资源很有限。从当前来看，给了一个主题，它只查了10个来源，这对于Deep Research来说是相对很少的。其次，因为看不到它的执行过程，所以不确定它是否会对搜索结果进行判断，然后再重新搜索，这是一个未知的情况。

第三个问题是它的输出。输出报告里的配图是先输出报告，然后再去配图。配图会从网上找一些图片，这就导致配图和内容可能会不相似。

第三个问题是，报告生成后，它不会在右侧直接把报告打开，而是必须用户手动去打开。这样会多一步操作，让人感觉不太舒服。

除了报告的功能，我也测了其他的，比如像PPT生成。这些感觉和其他的PPT生成功能会弱很多。那蚂蚁推出来这种和竞品有一定差距的产品，它的目的是为了抢占市场还是其他的目的呢？这个就不得而知了。

0 / 2000
Mustafa Suleyman · 2026-02-21 19:17

百灵大模型：

思考和工具调用两种分类，我主要用深度思考的Ring-1T来对话和写作，在对话上已经很像人了，在推理能力上满足我日常的交流和事物辅助分析需求

举个例子，我和它探讨了一个重病的母亲的案例，作为孩子需要用所有的钱去医治她，结果是挽救的概率很低，强行治疗干预只能延长活着一段时间，并且这期间母亲还会继续被病痛折磨，但因为孝道必须这么做，这是伦理问题，要它用电视剧天道里的主角丁元英的观点来讨论

它能给我的回复对角色的模拟很到位，大意是已经晚了，尊重生命必然死亡的客观规律，放手，倾家荡产与其继续让母亲延长痛苦，让自己的日子不好过也不是母亲愿意看到的，只好放弃治疗让她解脱，如果是早期发现病情，倾家荡产也愿意干预，它对强势文化和弱势文化理解的很到位，具体内容可以看图1

智能体广场：

在这里竟然有能用的视频提取文案智能体，还支持小红书和抖音，就是错别字有些多（图2）

有个问题，上下拖动浏览很困难，俺通过鼠标选中文字上下拉拽的方式实现浏览，很不方便

百宝箱的丰富功能：

功能大而全，它们通常由官方的多agent小组组成

可以自己搭配小组做新的功能，需要一定学习门槛

用设计功能，咱给降临派的吉祥物小查做了个马年特色表情包（图3）

总的来说这款产品，和它的名字一样，百宝箱，里面的功能基本都能产出像模像样的产品，算不上特别出色，但有这么多合格能用的功能，也挺厉害的，像我这样爱画图的用户，一次作图200积分，每天送的3000积分白嫖15次也不错，质量也还算可以，产品也有很多探索的空间，赞

0 / 2000
Lisa Su · 2026-03-05 16:41

最早是在一个展会上看到，但当时基本上没有to c可试用的，过了好几个月，这个才出来。

1、整体感觉是豆包+扣子的功能结合，这种把应用端和管理端结合起来的方式感觉不太符合现在的主流了

2、从智能体的配置来看，配置的功能有点简单，并且在知识库中上传满足要求大小的文件，20M左右，直接把浏览器干崩溃了，在一个小时之内，直接无法访问系统

3、从应用来看，不管是ppt还是其他的场景，效果都不太具备竞争性，生成PPT无法一步生成，还一定要人为介入才可以。

0 / 2000
Ronald van Loon · 2026-04-03 11:54

想给个中评的，好用不至于，难用也不至于。5/10

原来就是蚂蚁百宝箱，很久之前就在用了，当时的竞品是扣子，搭建工作流的模式。

现在改版了，还是对标扣子空间是吧，设计、ppt、数据分析、写代码、写文档这些似曾相识。

进入就给了10000积分，还以为很大方。结果做了一个图就花了500积分。你这搞积分通胀啊。

ok，进入测试。使用设计智能体，woc，试了一下我的提示词，做出来的效果堪比nano banana pro。

字体保持很清楚，字多了也没崩。设计感也有。

我不敢相信。

继续测试，内容一多（5000多字提示词），视觉效果依旧不错。

但是幻觉nm真严重啊。

生成的图内容跟我的指令内容完全不一样啊。

啊？

降低幻觉，我觉得是可用的。呈现效果其实挺好的。

0 / 2000
Riabovitchev · 2026-03-03 08:36

bad部分

1.界面似曾相识，没有自己的设计观，而是模仿。

2.生图质量一般般，送的积分有一万，生了一张图发现就用了200，相当于就能生成50张图，作为新手练手生图来说还是不错的，定位目前可以作为教育用ai工具如果想要追赶比较高分的那一两个同类竞品还有路要走（也许是因为后台模型还不太OK）

3.阿里其实有很多开源好模型，完全可以走自己一条路出来的，比如wan视频模型，还有qwen生图。但是似乎没看到自己的产品观。

0 / 2000
Suno · 2026-04-04 09:53

跑了一次“AI Agent 行业现状分析PPT”，整体略失望。虽然系统里展示了三个 agent 的任务拆分（全网搜索、结构整理、PPT 生成），拆分逻辑本身是合理的，过程也相对透明、可追溯，全网搜索助手抓取的文章数量也足够多，但这些优势并没有转化为一个高质量的最终结果。短板出现在交付层面，最终生成的 PPT 存在明显的图片排版错误、图片区域缺失、icon未加载等基础问题，视觉完成度偏低，影响正常使用。同时内容几乎全部是 bullet point 形式，偏概念罗列，观点空泛，缺少重点、结论和真正可用的洞察，更像是“资料汇总”，而不是一份可以直接拿去汇报的成品。对比z.ai的PPT生成功能，两者差异更加明显。z.ai虽然在内容深度和研究过程上相对简单，但成品稳定性和视觉完整度更高，基本不会出现图片或 icon 缺失的问题，生成后可以直接使用；而Tbox 更强调过程和多智能体协作展示，却在质量控制上明显不足。整体来看，如果只是想快速得到一份“能用的PPT”，z.ai的完成度更高；而Tbox目前更像一个概念验证型产品，而非成熟的PPT生产工具。

0 / 2000
陈天奇 · 2026-04-10 22:02

今天用了下tbox，说是集合了很多的智能体，它覆盖了PPT设计、应用、网页等多个领域。PPT相关的平台很多，加上它只展示了两个案例，我就没使用。我先试了设计功能，让它做了一版设计，效果很一般；之后又让它在原有基础上修改，也没改出什么亮点，虽然也不会像即梦、lovart那样乱改，感觉在设计这块远不如专业设计网站lovart好用。我还上传平面图让它生成产品渲染图，整体效果很不对劲。最近Gemini的圣诞树很火，我就用相同指令让它生成网页版圣诞树，第一版效果其实挺美的，还有雪飘下来的动态感，不过后面生成的几个版本就远不如第一版了，整体还是偏几何图形，没有圣诞树该有的感觉，而且在一个对话内生成后面几版后还没办法基于第一版生成的内容调整。另外我还试了用它生成漫画，这个表现还行，文字准确性有保障，我还让它设计了iPhone历程的网页，问题挺明显的，最顶端没有图片，设计的比较简单，中规中矩，时间线更新得特别滞后，只展示到iPhone 15，16、17这些后续机型都没包含进去，没有跟上最新的产品节奏。最后试了一下模板里有的下五子棋，感觉这个效果还行，还挺准确的，先给个bad，期待后面做得更好。

0 / 2000
Antonio Grasso · 2026-04-11 08:12

虽然可以看到有智能体协作，但是从效果上看与通用大模型的结果很类似，每个场景都能做，但是不精，玩一玩可以，如果用来生产和工作，恐怕不太行。

比如生成PPT，我已经把文字稿给他了，结果自己又胡编乱造了内容，而且PPT是直接套模版，不能上传自己的模版或者像智谱那种根据内容生成排版，总之不太适用真实使用场景，几乎没法用。另外生图和生成应用也差不多，功能能用，但是效果一般，指令执行的很差，不如专业平台的效果。

另外这是蚂蚁旗下的产品，没看懂该产品的定位是什么？对标扣子？豆包？

0 / 2000
Lisa Su · 2026-04-12 19:37

这个不难评，就是很直接的 bad，还是贼差劲的那种

请原谅我有点不礼貌了，直接在微信上搜 Tbox，第一页没找到～至少广子是不多的 ?

还有开局积分送很多，这个可以给个好评

第一个 case，之前我对象喜欢让 AI 扮演角色，给她一些建议。那我就说，让我来手搓一些智能体吧～

Tbox 上面有一个智能体小组的概念，创建个人智能体，其实就是搭几个提示词应用，那我就整了几个：小董、肖庄，还有天真

好家伙，我本来是让你们群策群力的，但奈何听不懂大白话，必须一个一个 @你们才肯发言，感觉智能了个寂寞

第二个 case，开发个应用吧，掏出之前给秒哒没完成的需求说明书

这个智能体在后台工作，可以设置消息通知，这个指引还挺贴心～

然而，你们的作品一出来，我血压都高了…… 怎么是个校园招聘软件？难道是我给错需求了吗，认真翻看记录，我的就是要求做个 “降临派” 的导出助手，然后你的产品设计专家出 PRD 文档的时候，就给我直接改需求啦，服气！

回过头来好好看看首页，这个排行榜是想做模型盲测吗？还有开放平台和百灵大模型，是什么鬼？

所以Tbox 百宝箱的定位是什么呢，啥都想要啥都不精吗？

阿里系的产品体验一圈下来，一个很直观的感觉就是产品力在下降，曾经那些好用的产品，要么变得越发臃肿，要么被收编为底层小弟；曾经 BAT 的老大都知耻后勇了，那你呢？不如省点广告费，好好打磨一下产品和场景，做点真正能用、好用的东西

最后给个建议：Vibe Agent 好像还没人做

0 / 2000

Tbox「超级智能体」

通用助手

22 个评论