🤖 AI总结
主题
OmniWork作为AI专家操作系统的功能体验与行业分析
摘要
OmniWork作为Agent OS,通过多专家协作实现短剧、音乐、游戏等创作任务,并具备持久记忆和Skill封装能力,展现了AI工具从模型到流程能力的转变趋势。
关键信息
- 1 OmniWork通过多Agent协作实现短剧制作、音乐生成、游戏开发等复杂任务。
- 2 产品核心是专家经验系统化,支持Skill封装和持久记忆。
- 3 AI创作工具正从模型能力转向流程能力竞争。
![]()
AI专属顾问、私人专家团……类似说法的产品,大家可能听过不少。
但总是觉得,很多所谓的AI专家,还是不够专精、不够有行动力。
像AI版赵括,擅长纸上谈兵。
回答看起来洋洋洒洒,实际还是豆包型人格。
说它有用吧,看到答案后,只会若有所得,不知道接着干啥。
近期我对Agent的印象,因为一个叫OmniWork的产品,有了新的改观。
比起单一的专家,它更像个OS系统,一个能打配合、系统作战的专家团。
![]()
https://chat.omniwork.ai/
01做了一次短剧视频,一键拥有专属Skill
短剧很火,做AI短剧漫剧的产品也不少,但很少从“人”的角度来切入。
影视工作流与角色分工,除了可以被模型标准化的部分,剩下的,还是非常依赖于专家的审美把关。
大部分视频AI产品,承担的更偏视觉总监、摄像、剪辑制作的职能,但是在导演、制片、音乐等等角色上,总有局限性。
![]()
OmniWork在专家角色上,延展性很强。
除了自带的导演、制片人,还可以自己创建新英雄,用更垂直细分的专业形象,来满足差异化的需求。
昨晚凌晨,我坐在电脑前,把OmniWork生成的这个短剧demo看了好几遍。
不是因为它不好,恰恰相反,是它好得让我有点恍惚。从画面动态到音乐,都很能打。
十分钟前,我往OmniWork里扔了一个想法:一个关于都市男女互换身体的短剧概念。
然后我去倒了杯水,刷了会儿朋友圈回来发现它已经给出了完整的三集剧本框架、分镜表、角色设定图,甚至连第一场戏的粗剪视频都渲染好了。
![]()
现实把脚本情节,分剧集、分片段,跟我确认好。
然后给出了视觉风格的参考,以及音乐相关的下一步建议。
![]()
随便选一帧图拿出来,都是不错的水准。
几位专家的配合也很有意思。
有临时专家做外援,参与支持,也有已经召唤的导演专家出谋划策,还有视频专家落地把片子最终做出来。
很多产品因为AI,都像是知乎上的大神,谈天说地无所不知。
但OmniWork里给我的感觉是真懂,虽然预设的专家数量不算非常多,但单个专家的数据,很丰富优质,属于能说出来行业细节和水下信息的那种。
再一个,除了能说,还得能做到,最终目标还是交付结果。
好比是诸葛亮和关羽张飞合体,有勇有谋还能打。
完成一个任务后,弹出提示:可以把任务一键封装成Skill:科幻剧制作人。
![]()
点一下,专家们自己开始行动,挺容易上手的。
科幻题材里需要的想象力、科幻阅读量、科学题材等等,这些能力按照一个创作者真实的工作流,系统性地组织起来。
OmniWork扮演的,像是行政总厨的角色,也像公司里的PMO、大管家。
![]()
做影视、做AI短剧的朋友,如果试了OmniWork,相信会得到不少启发。
多拥有几个影视专家,再多几个随时可调用的影视技能,用起来,挺香的。
02当想要更好的BGM,结果有了音乐专家团
很多人对AI音乐生成的认知,还停留在输入一段描述,出来一段还不错的背景音乐。
市面上大多数工具,也确实就停在这里了。
OmniWork的音乐生成,因为专家角色的存在,可以和其他场景任意组合。
比如做一个PPT,可以配套变成有声版;做一个网页,也可以让音乐注入灵魂;做视频就更不用说了,甚至因为音乐的高匹配度,让我觉得有了「音乐短剧」这样一个细分领域的机会。
我给OmniWork的一个任务是:生成一首针对职场焦虑人群的疗愈音乐,时长三分钟左右,要有明确的呼吸引导节奏。
![]()
没有给任何技术参数,没有说调式、速度、配器,就像你去找一个音乐制作人谈单子一样,我只说了我想要什么感觉,给谁用,大概多长。
OmniWork调用了音乐疗愈领域的Expert。
这个Expert不是通用的音乐生成模型,它的底层技能模块里封装了上海音乐学院那个实验室沉淀的一些专业框架——
比如疗愈音乐中,432Hz频率通常用于深度放松,60拍左右的速度能匹配安静状态下的心率,调式上Lydian比Major更能制造一种温和的上升感。
![]()
它给我的第一版方案里,不只是输出了一段音频文件。
它同时给了一份制作说明文档,里面标注了:
主旋律用了哪几个音阶,为什么选这个速度,呼吸引导点安排在哪些小节,甚至还有一个简单的波形图示,标注了动态范围的控制逻辑。
从旋律到歌词,都会有更丰富的选择。
![]()
![]()
我听完第一版,感觉前奏的进入有点突兀,不够渐进。
我在对话里说,能不能把开头那段合成器铺垫拉长四小节,用一个更柔和的滤波器切入。
三秒钟后,它回了两个字:好的。
然后它开始重新生成。
这个过程中,它调用了上一个版本的项目记忆,记住了我之前对疗愈场景的偏好设定,还主动问我是否需要同步生成一个简版的乐谱,方便后续如果要做真人演奏录制时参考。
我当时的真实感受是,这不像是跟一个工具对话,更像是跟一个靠谱的音乐制作助理沟通。
他知道我在说什么,也知道他自己在做什么,甚至能预判我下一步可能需要什么。
最终交付的成品,音质、结构、情绪曲线,放在任何一个疗愈歌单里都不会违和。
但真正让我在意的不是结果,是那个过程。
它没有让我去学任何专业术语,没有让我去调任何参数,我只需要说我的需求,它用它的专业知识来落地。
这就是专家驱动和通用模型的根本区别。
通用模型是,你懂什么,它帮你加速。专家模型是,你不懂什么,它替你搞定。
03从策划到上线,一个小游戏水灵灵做好了
一个HTML5小游戏,能交互的那种,能做吗?
我是一个写过代码的人,我知道一个小游戏从想法到能玩,中间要跨过多少坑。策划、美术、前端、测试,正常来说三到五个人是最低配置。
我在OmniWork里创建了一个新的Expert Team,选了游戏策划、前端开发、美术资产三个Expert,给了一个共享目标:
![]()
我想做一款点击收集类的轻量小游戏,主题是太空废品回收员,玩家控制一艘小飞船,在规定时间内收集不同种类的太空垃圾,每种垃圾有不同分值。
![]()
然后我就看着四位专家,开始在同一个工作区里各自推进,同时彼此同步状态。
美术资产Expert同步开始出图。角色立绘、飞船造型、不同类型的太空垃圾图标、UI按钮、背景图,每出一批资源,就自动提交到共享工作区,前端Expert那边可以直接调用。
游戏策划Expert先给出了一个完整的游戏设计文档,包括世界观简述、核心循环、分值体系、难度曲线、操作说明文档里甚至标注了哪些设计决策会影响前端开发的工作量,哪些美术资源需要优先产出。
前端开发Expert拿到策划文档后,开始在虚拟执行环境里搭建项目框架。
它选择了HTML5加原生JavaScript的方案,没用任何重型框架,因为目标是轻量、跨平台、加载快。它自己划分了sprint计划,先搞定核心玩法循环,再加UI和计分系统,最后做动效和音效集成。
![]()
我全程几乎没插手。
只是在几个关键节点给出了方向性的意见,比如我觉得初始难度偏高,玩家可能还没上手就死了,需要调整垃圾的生成频率和飞船的碰撞体积。
整个项目从启动到输出一个可玩的HTML文件,用了大概十分钟。
![]()
期间我去开了个电话会,回来发现它还顺手帮我写了一个简单的游戏说明弹窗,因为前一个版本测试时发现用户进入游戏后不知道该点什么。
然后又生成了一个改良版本,更赛博朋克的风格。
我打开那个HTML文件,在浏览器里跑了一下。
![]()
核心玩法成立,画面风格统一,音效虽然简单但跟主题契合,甚至还有一个本地排行榜功能,记录玩家五次最高分。
虽然没到能上Steam商业发行的级别,但作为一个验证demo,一个十分钟的完整交付,还是很让人开心的。
整个过程里,我没有写一行代码,没有画一张图,还能反向教我不少关于做游戏的经验、流程。
我只是说出我想做一个什么样的游戏,然后看着一支AI团队把它搭起来。
像是给阿斗,配上了最牛的辅助团。
04AgentOS级体验的背后设计
我还设置了一个Autowork任务:
连续一周,每天早上八点,自动追踪小红书上AI视频、AI影视、AI短剧、AI视觉、AI审美相关的热门笔记,收集点赞过五百的爆款内容,分析它们的选题方向、标题公式、配图风格,每天下午六点前生成一份简报,供我参考做自己的内容规划。
设置这个任务大概花了我两分钟。
![]()
然后我就把它忘了。
第一天下午六点,提示我有了一份简报。
里面有当天最火的五篇笔记的链接、截图、数据,还有一份分析,总结了高互动内容的三类选题方向和两种主流的封面/配图风格。
![]()
第二天,简报里多了一个趋势对比,把当天的热门选题跟前一天做了交叉,指出有一个关于AI生成商业产品图的方向连续两天热度上涨。
第三天,它没有只给我数据,还主动生成了三组可以参考的标题文案和配图方案,标注了每组方案针对的目标用户和预期效果区间。
![]()
这就是Autowork的价值。
它不是等你来找它,而是按照你设定的规则和目标,持续在后台运行,主动推进,定期交付。
传统的AI工具是对话式的,你问一句,它答一句。
你停下来,它也停下来。但创作工作不是这样的。一个好点子的诞生,往往需要持续的信息输入、跨时间的联想、某个时刻的突然触发。
当AI可以不需要你每步都参与就能持续工作时,角色就从操作者,变成了管理者。
终于可以,我只用关心,它最终有没有把你要的东西放在你桌上。
![]()
有几个让我觉得真正有技术含量的设计:
首先一个,持久记忆的三层结构,不是噱头。
我在做音乐那个项目时,中间隔了两天去忙别的事,第三天回来继续,它还记得我之前偏好暗色调的视觉风格,记得我上次要求过更渐进的音乐开场。
这种记忆不是简单的历史记录回放,而是在新任务启动时被动态检索、判断相关性、然后融合进当前的推理过程。
再一个,Skill的可复用设计也很聪明。
![]()
比如短剧分镜拆解这个方法,原本是影视创作领域的专家经验,被封装成一个Skill后,可以在不同的创作任务中被调用。这就意味着,使用这个产品的人越多,沉淀下来的专家经验就越多,整个系统的能力边界会不断扩展。
还有那个开箱即用的执行环境。
对非技术背景的创作者来说,不需要配置服务器、不需要装Python环境、不需要解决依赖冲突,打开网页就能跑一个完整的游戏开发项目,这种体验本身就是一种能力。
了解到,OmniWork的团队,他们反复强调一个观点:
下一代创作软件的核心不是更强的单点工具,而是能否围绕真实创作流程,建立一套支持Agent长程运行、持续协作、稳定交付的系统环境。
用了这段时间后,我觉得他们确实在往这个方向走,而且走得比大多数同行都远。
05
写到这里,我想从行业观察者的角度,聊几个更深的判断。
第一,AI创作工具的竞争,正在从模型能力竞争转向流程能力竞争。
接下来,真正的分水岭会是谁能把模型和Agent能力,按照真实的工作流组织起来,让用户不用学习新工具就能用AI完成完整任务。
第二,专家经验的系统化是AI产品真正的护城河。
OmniWork跟上戏文化、上音实验室的合作,不是营销噱头。
导演怎么组织镜头、音乐制作人怎么配置和声进行、游戏策划怎么设计难度曲线,这些经验在传统模式下只能通过师徒制、工作坊、多年实践来传承。
当这些经验被结构化、产品化、变成可调用的Skill时,它就成了一个可复用的资产。
![]()
OmniWork的专家市场
第三,Agent OS的方向是对的,但执行难度极高。
让多个Agent协作完成一个复杂任务,涉及任务拆解、资源调度、冲突消解、状态同步、异常处理等一系列系统工程问题。任何一个环节出问题,整个协作就会崩溃。
OmniWork在这个方向上的探索,目前看来在影视、音乐、轻量游戏这几个垂直领域已经跑通了闭环。
但要做到更通用的创作Agent OS,还有大量工程优化要做。
第四,这类产品最终会重塑创作者的工作方式和行业结构。
当一个创作者可以靠AI团队完成原本需要三到五个人才能完成的工作时,小型工作室、独立创作者的生产力会被极大释放。
一个人加一套工具,可能就能产出过去一个微型公司才能产出的内容量。
最后说点实在的。
![]()
OmniWork目前还在内测阶段,邀请码制,官网是www.omniwork.ai。
我这有几个邀请码,想体验的朋友可以在评论区留言~
强烈建议:当成你真金白银雇的一个专家团队来用,给他们一个真实的任务,看他们能交出什么样的答卷。
也许你会突然发现,自己在创作这件事上,居然这么有天赋。