菜单

哎呦不错:第955期

简单图床 - EasyImage
@ 投鱼问道:昨天和一老师聊天,说 21 年看中鼓楼一套房子,400 多,老公不让买,吵了很久,还是没买。现在 200 多。太幸运了。
我说,你老公很厉害,那个环境下,老公能顶住老婆买房压力,也确实不容易啊。

@ 安迪斯晨风:以前感觉 100 元是个财富临界点,只要不买大件家具家电、手表自行车之类奢侈品,买菜吃饭日常花销,手里有 100 元就都能应对。现在这个临界点需要涨到 2000 元了,钱是真不经花,去趟超市,二三百就没了。 ​​​

@ 热心少女胖小妹:看了周公子的访谈,上个世纪八十年代在上海卖馄饨就一个月挣大几千了,到后来做个体户各种卖瓷砖等等的生意都挣钱,这一块属于时代的贝塔。
后来开阿毛炖品,九几年人均消费 1000 块,靠高端餐饮结识不少金融行业人士,进入证券市场靠资本运作挣钱就是阿尔法了,当然也有贝塔,那个时代监管很松。
生在好的时代很重要,还有我经常说的话,大部分挣钱的机会都在行业缺乏监管的时候。

@ 九边 Pro:说起来创业,不少人第一反应是 “需要很多钱”,或者 “赌上自己的身价”。说真的,这是垃圾电视剧看多了。我这些年碰到的做的特别成功的那些,极少是从初期投入极大的。他们基本都是投时间不投钱,然后在不断的 “尝试 - 失败 - 再尝试” 里慢慢成长,过一些年慢慢就做大了。
还有不少就是一边上班一边做,当做兴趣爱好经营,初期几年没啥收入,后来副业收入超过主业了,然后辞职跑路了,这种更多一些。
那种输一次就倾家荡产的,你还是别折腾了,你肯定会输很惨,你去炒个菜第一次都不一定能炒好,更别说创业了。

@ 方出神:年轻的脸胜过一切,钱也胜过一切,情感胜过一切,无所谓也可以胜过一切。胜过一切的有很多,认真选一个就好了。 ​​​

你假惺惺的,我可怜兮兮的,咱俩也算惺惺相兮 ——@ 瘦子你胖了_ ​​​

“谢邀,人在美国,刚下飞机”—— 节选自《2001 年 9 月 11 日地狱访客记录》——@ 水无月_政宗 ​​​

大师说我有业障原来是有就业障碍 —— 笺墨无颜 ​​​

现实
这几天中国时政类网友都在教泽连斯基做人、教川普做人、教万斯做人、教欧盟做人。
然而一回到单位,TA 就被上司教做人。
回到家,又被老婆教做人,一声不敢吭。
这就是中国时政类网友的总体生存状态。

涨价
大家注意了,根据《中华人民共和国关税法》、《中华人民共和国海关法》、《中华人民共和国对外贸易法》等法律法规和国际法基本原则,经国务院批准,对原产于美国的部分进口商品加征关税。其中,对鸡肉加征 15% 关税。为响应国家号召,今后每周四请 v 我 60。

对策
问:孩子说下次进班级前三,就要奖励他 500,我要不要答应?
答:现在就把 500 给他,考不进班级前三让他退。

反思
突然想到:把水烧开了喝,那水的营养不都没了吗?

决心
当我听到,一个 30 岁的人三战之后还未考公上岸,将自己左手三根指头砍掉,报考残疾人公务员岗位,以减少竞争。那一刻我人傻了,陷入了沉思。

悲哀
人生第一次租房子,下班就忘记房子租在哪了,房东也联系不上。
突然有种累了一天,发现找不到牛棚的感觉。

怪事
因为中二病也知道这么一个规律:
那就是坏人做一件好事,就瞬间洗白;
好人做一件坏事,就瞬间拉黑。
这么低成本的邪恶,谁不干谁傻逼。

愿望
飞机即将坠毁,一名女乘客跳起来大喊:“如果我要死,我想像个女人一样死去!”
说完,她脱掉衣服说:“这个飞机上有没有真男人,能让我觉得自己像个女人?”
一名男乘客喊道:“我!”
他站起来,脱掉衬衫说:“来,把这个给我熨平了!”

相似
很多网友就好似吸血鬼:
遇到各种屎和冷酷都能谈笑风生,可一旦碰到爱和光明,就会立马痛不欲生,灰飞烟灭。

绝大部分人其实属于自卑人格

@ 九边 Pro: 小时候父母都担心孩子将来 “骄傲” 了,从不表扬,现在好了,绝大部分人其实属于自卑人格。

自己的利益不敢争取,碰上机会也不敢抓,尤其是表现机会更是往后躲,怕失败怕的要死。其实 90% 的尝试注定都是失败的,为了那 10% 的成功率,咱们就得多行动,不断尝试,自卑的人天生不敢去尝试。

我以前做员工的时候就怕自己成了显眼包,后来做了领导才知道,领导其实希望下边的人积极主动,你不来找我,还指望我去找你不成。

这一点大城市的孩子占便宜很厉害,社牛比例高的离谱。他们不自卑,看谁权力大往谁那里凑,不卑不亢谈笑风生,时间长了混个眼熟,有啥事可能就想起来这孩子了,长期优势慢慢就积攒出来了。

比如我以前的一个同事,北京的,整天跟领导们凑一起抽烟,我还以为他是个领导,后来发现他也是新来的。他就是那种高考分数很差上大学的,但后来混的非常好。

此外自卑的人一辈子都很苦闷,太难了

分享我对 Manus 的完整体验吧

@ 阑夕:

Manus 刷屏一天,从开始的一夜成名,到中间的一码难求,再到质疑它的宣发一掷千金,整个过程里,FOMO 情绪和直觉警惕交缠不休,是很有意思的传播学样本。

其实 AI 行业这几年来一直都是「炸裂驱动型」的资讯模式,了解的都已经祛魅了,不了解的却还会少见多怪,但是有一说一,天天这么炸裂下来,客观上也会存在真的炸裂蒙混其中。

而我对 Manus 的评价就是,它确实属于真·炸裂的那一桌,称得上 AI Agent 行业的 DeepSeek 时刻,不过有个补丁,结尾时我再叠上。

先看 Manus 的一个演示效果:让它开发一款文字互动游戏,可以扮演谷歌公司的 CEO,通过体验公司历史上的重要决策,既能获得游戏的乐趣,也可以顺便了解公司的文化。

用了差不多一个小时,Manus 把谷歌 CEO 模拟器的网页游戏开发好了,完成度很高,点击开始游戏,还会让你自选难度,接着就会面对谷歌发展史上的每一次转变节点,你的选择会决定公司资源的变化,并影响最终的游戏结局。

在一个小时里,用一句话,做一个游戏出来,这就是 AI Agent 的能力。

它和传统的对话式 AI 不同,不再只是提供信息层的答案,而是能够操作电脑完成更加具体的工作任务,包括但不限于写程序、做网页、整报告、筛简历等等等等,它能够完全自主的解决过程中遇到的各种困难,并交付工作结果,

当然也有例外,这个例外我们后面再说。目前主流的 AI Agent 服务不多,而且普遍很贵,比如 ChatGPT Operator 需要 200 美元一个月 Pro 会员才能使用,还有主打编程市场的 AI 工程师产品 Devin,每个月的费用更是要 500 美元。

Manus 的开发商是中国大模型团队 Monica,目前是免费测试阶段,单任务成本压缩到了 2 美元,是 OpenAI 的 1/10,同时在基准测试的排行榜上已经超过 OpenAI 拿下了全球最强。

再来看看我自己的实测案例。

首先我让它帮我做一张 linktree 风格的个人主页,Manus 把这个任务拆成了 8 个步骤,先在全网搜集我的资料信息,包括我在各个平台的链接以及代表作,然后基于 linktree 的设计风格开始编写网页代码,半个小时之后,它交付了这么一个作品给我。

简单,但是完美符合要求,交互也都没问题,写轮眼级的复制效果,如果想做得更美观,还可以继续写提示词让它修改。

第二个测试,是我用 Manus 帮一个工程师群友解决实际问题,他在工厂里负责维护的阿特拉斯机械臂出了点小问题,找售后的话费用要花几千块钱,不如自己想办法找补,他又懒得看文档,于是直接给了我一段话,让 Manus 看看怎么处理。

注意啊,这个需求理论上普通的对话式 AI 也能接住,但会需要更多的交互流程,比如你得把文档喂给它,一步一步的得到答案,但是 Manus 不需要这些,它会自己去阿特拉斯官网下载文档,读完之后找到解决问题所需的关键内容,仔细分析,创建程序,最后的代码我发给了朋友,有点小瑕疵但手工修改之后完全可用,直接省掉了一次售后呼叫的次数。

第三个测试,是我的微博读者提议,让 Manus 去做一个国家的极简编年史,我增加了漫画表选和网页设计的要求,最后交付的作品配色有点难绷——AI 没有审美,这点必须反复强调——但是这时 Manus 的服务器已经宕机了,暂时没法修改,所以我也就把半成品展示出来吧。

可以看到,Manus 将英国的历史分成了 10 个不同的时代,并基于时代风貌绘制了 SVG 图片,最后呈现在 HTML 的网页端,可以说是人机协同的样板间了,无论是作为课外教案还是作品预览,都有极其便捷的上手门槛。

最后一个案例,是我让 Manus 做一款消消乐游戏,但是图标得用原神的角色,它先是开始研究消消乐的游戏机制和实现方法,接着试图搜集原神的图片素材,这个时候就出现例外了,它第一次发出了接管请求,原因也很让人无语,它的运行逻辑被一个网盘给堵住了,没法注册账号,所以下载不了资源,想让我帮它去下载。

看来再强大的 AI,也会被网盘的会员拦在门外。

本着尽可能让 AI Agent 独立完成工作的原则,我没有这么做,而是稍微改了一下需求,让 Manus 改用科技公司的 logo 来做游戏图标,因为开放版权的 SVG 素材全网都是,所以这下 Manus 跑起来就没什么问题了,很快就做完了一个带积分的消消乐游戏,玩起来也算顺畅。

不过也能看到,在解决这类相对复杂的问题时,Manus 在细节方面的缺失还是有的,这也和人类(我)参与过少有关,比如对屏幕的适配问题,需要给它更多的说明,Manus 的修改响应也不慢,但因为同样遇到了服务器宕机的麻烦,这个任务暂时没有继续精进下去。

我觉得这几个实测例子已经可以非常清晰的表明,AI Agent 在现阶段的能力和不足,Manus 已经不是那种只能操作浏览器的产品了,它本身具有沙盒环境,能在完成工作之前自行进行测试,验收合格再做交付,但也限于互联网的数据边界,如果网络上的资源不够,它是没有办法生产资源自给自足的。

我还做了一些偏文书类的测试,也可以用来对比 AI Agent 的特点:

比如我让 Manus 根据 B 站最热门的 10 个星见雅(游戏角色)视频,给出她的操作技巧。

Manus 是真的足足看完了 10 个视频——花了一个多小时的时间——再去把各个 UP 主的小作文精炼成了我要的材料,而且相当准确,同样的任务如果交给联网的大模型去做,虽然也能完成,但幻觉的产生概率很高,在「老实」程度上不及 AI Agent 靠谱。

再如让 Manus 去研究 PolyMarket 的套利可能,虽然我确实有那么一丝期待,想得到一个稳赚不赔的投资指南——别笑——Manus 倒是兢兢业业的做足了功课,列出了四个套利机会,让我只要在 PolyMarket 看到符合条件的项目出现,就能无脑按规则下注。

从回放来看,Manus 每次都是从最基础的信息开始切入,先了解 PolyMarket 是什么,再分析预测市场的游戏玩法,接着结合平台规则构建风险策略,标准的实习生作风,任劳任怨,踏实耐用。

对了,回放这个设计,在我看来也是 Manus 的亮点之一,它有点像推理模型暴露思维链的选择,很多时候,AI 的思考过程要比答案供给更能给人启发,Manus 的每一个任务都有回放功能,且可被分享出去,它在解决问题的途中所展现出来的手段,完全称得上是另一种形式的智能资产,可以扮演人类的老师。

所以话说回来,我评价 Manus 是 AI Agent 行业的 DeepSeek 时刻,这里需要打一个补丁,是 DeepSeek-V2 时刻,2024 年 5 月,DeepSeek 开源 V2 版本的模型,这是它第一次出圈,因为价格非常便宜,但是因为模型本身的能力一般,所以当时很多人只是觉得 DeepSeek 要来打价格战了,感到意外但不重视,热度也没有持续太久。

直到 DeepSeek-V3 和 R1 的连续发布,大家这才发现事情完全不一样,一夜之间整个大模型市场的成本逻辑都被颠覆了。

「最初,没有人在意这场灾难,这不过是一场山火,一次旱灾,一个物种的灭绝,一座城市的消失,直到这场灾难和每个人息息相关。」

我的意思是,AI 技术的发展是连续性的,而在这条跌宕起伏的曲线上,每一次的信号强度都决定了后面的突破深度,就像 DeepSeek 没有 V2 就不会有 V3,更不会有 R1,我对 Manus 的看法没有变化,在把 AI Agent 服务从专业场景带向通用场景的历史转折点,它就是开山立派的创始品牌。

Archives QR Code
QR Code for this page
Tipping QR Code
Leave a Comment

2 Comments
  1. 上安吧 上安吧

    哎呦
    真不错

  2. Leo Leo

    感谢楼主分享 受益颇多