VC行业史无前例的大洗牌

今年,VC的日子都不好过。某种程度来说,可能是2008年金融危机以来,最严峻的一年。数据就不用说了,整体行业今年的萎缩还是相当厉害的。我比较坚定地认为,VC正在经历一场创投史上少有的,中长周期的大出清/大洗牌,而疫情三年,尤其是最近两年,只是这场大戏拉开序幕的起点。

01 VC正在迎来一次史无前例的大出清

为何这样说,因为VC行业基础的影响变量发生了本质的剧变,这些剧变,会让很多既有的VC打法不再奏效。
如,整体经济增速下滑,找到一个可以系统化布局某一个赛道的机会会越来越难。对于VC机构,进行赛道型布局,其实是管理难度相对比较低的一种做法。赛道型布局奏效,有几个前提:1、首先要有大趋势清晰的,体量很大的赛道存在,且不止一个;2、要有足够的赛道发展斜率,行业发展最终会收敛成几家,这样才能用一个成功项目去覆盖足够多的失败;3、VC机构本身要有很大的资金体量和品牌基础,这样才能够用高薪挖来“常春藤”、“清北复交”的聪明投手,并且能够连续出击提高胜率。这些其实在当今创业市场显然都不存在了,只不过不少机构还在延续着这个惯性。
再比如,当单一项目稀释后能赚个20倍,就不错了的时候,一个VC公司的决策模式就必须发生变化。比如就得降低失败概率,不能光指望100倍的项目来覆盖全部。这样往常一两个投委比较集中,通过通用的逻辑来进行决策,不那么深刻了解行业规律的决策机制就会出问题。要么就得有很强的专业属性聚焦一两个赛道,来确保决策的有效性;要么就得有个比较好的决策小组这样的联合决策机制,来适应几个方向的布局。其实在国内,覆盖几个方向的VC机构,很少有能够做好小范围的集体决策的,很多机构决策成本一上来,就分拆成行业基金,而每一个行业基金,如果又比不上专业做一个方向的VC机构的话,就会缺乏比较优势。
再比如,国资会彻底改变市场的权重和玩法。国资VC毫无疑问会成为未来5-10年VC市场最重要的玩家之一,这个趋势是不可逆的。为何?因为未来20年,科技创新一定是中国创投的核心投资主题。而科技创新的来源是什么呢?研发创新的本质规律,就是需要大量的、长期的资金的投入,因此很多都是来自于军工、高校、院所。而东亚的文化整体而言,先天鼓励集体主义,和西方文化更鼓励个人主义,由此带来更多的自下而上的创新不同,在这个背景下,解决高精尖问题,注定大部分是由国家队,或者说国家资源向市场外溢来完成的。而这个情况,就注定国资占据整体性优势,更加切合中国的VC主题能力的源头,扮演越来越重要的作用。
此外,资金结构的变化,就不用多说了。在国际政治的背景下,又要投资核心技术的主题,美元基金在中国整体边缘化是大概率的(可能投资中国企业的国际化另说)。
等等等等……VC行业,遇到了中国自VC从无到有之后,最大的一次变局。

做几点对未来5-10年中国VC格局的几点猜想:
1、国资会扮演重要的角色;
2、目前成熟的,比较成体量的基金会进行激烈的内部厮杀,留存少数一批选手;市场化平台型基金会和国资基金进行激烈的能力竞争;
3、美元基金相对边缘化;
4、长尾基金大量僵尸化,VC数量会大幅度减少,VC创业门槛会持续加高;
5、会出现一批特色的,各自用不同打法生存下来的特色基金,规模不一定小,但是必须在同一打法中,排到上游,才有空间。

02 VC进入了战略考验战

战略对于VC到底重要么?我坚定认为答案是极其重要的。
有的业内人认为,想那么多干嘛,坚守行业专业性就是了。这种想法本身没错,我相信,未来的VC,如果没有专业追求,压根就不在牌桌上。但是专业性能够持续积累是需要大量的基础前提条件的。就类似于大家都熟悉的车企,研发人员谁不想专业,但是专业是需要钱的。如果公司没有销售规模,没有毛利率水平,就没有足够的钱来招足够多的人来做研发。而这个又是取决于可能公司3-5年前的战略的。对于VC机构,其实逻辑是类似的。
行业有大量低垂果实的时候,战略好不好,区别还不那么显著;但是当VC全行业进入Hard模式后,战略就会变得重要了。在VC,首先是要去找好生态位。现在,国内的VC,实质上很少在通过生态位在划分大家。更多的是按照资金属性划分为比如国资、美元、家办;或者按照行业属性来划分为投医疗的基金、投硬科技的基金、投消费的基金等。而这个不是本质,未来划分生态位的,是一个VC生存的底层逻辑,形成同一个打法下,有比较优势的底层逻辑。
先说一个判断:有生态位意识的VC,会先行一步;找准了生态位,并且有战略定力的VC,会有更大概率赢得同一生态位之战;战略漂移的,会被出清。
比如,国资先天就有资源有钱,就有更多可以本地协同,调动资源的抓手。如果一个市场化的VC,并没有坚定的定位成服务国资的VC,而只是因为不好募资,跟着国资的打法套路跑,那么就很难干出啥大成果来。比如,如果追求单纯的财务收益的VC,没有击穿某种能力和资源瓶颈,干着干着又动作变形,那么也会有问题。再比如,如果一个金融背景的VC,硬是要聚焦一个产业链上下游深度耦合的产业,可能在pk这种赛道的cvc方面,就会有更大的风险。
VC毕竟还是一个企业,我是谁,我要到哪去,这个命题,VC和所有其他创业公司一样,都是根本命题。
有的人可能会说,没有办法,我要活,现在市场不好,我必须怎么怎么样。这个其实没错,但是从市场整体而言,市场是不会管单个VC死活的。所有的生态位,都没有绝对的优劣之分,但是一定要想明白自己在哪。既要、又要、还要,一定会出问题的。正如一个汽车品牌,不能自己又定位高端又定位大众,一会定位科技感,一会定位“家”。和所有的企业一样,一旦VC锚定了某种生态位,构建的能力和体系,是很难让自己回头的。比如一个VC,一旦定位为服务国资,那么就注定和定位追求绝对的回报率,长出不一样的物种。大平台基金形成的组织逻辑,也一定和CVC不一样。一会这一会那,一个VC就会成为一个四不像,每一种方向上,都缺乏绝对的竞争力。
VC的生态位,从混沌到清晰,考验VC机构掌舵人的战略判断能力、选择能力,和战略坚守的定力。要看清自己的生态位,做到最好,才能够安全地活下来。
比如,如果做CVC,就应该在一个产业周期区间内,充分利用好产业资源,做好服务,做好资源的充分变现,不一定要刻意克制规模。比如国资,就要充分响应国家战略和地方政策,不必然要试图像市场化VC那样积累所谓追求纯财务收益的能力。国资体系是庞大的,科研院所系、地方政府系、产业央企系、部委系、银行系,这些国资所追求的底层目标都是不同的、非标的。比如如果是Solo VC,就不要试图盲目扩大规模,扩大队伍,吃透一亩三分地。再比如,大平台VC的竞争,会是非常艰辛的一场战。因为大平台VC的底层逻辑就不是吃绝对收益的,而是要形成综合能力的最优解,这样就需要品牌建设,战略投资,生态构建,等一系列的体系建设,谁能够在这些建设方面,实现更好的协同效应,就会有更强的竞争力。平台VC之间,能力更强的,会PK掉能力不足的,此外,未来,市场化平台VC一定和平台国资VC竞争会加大,因为他们的生态位有重叠,这也是我相信,一定会有一部分主流平台VC会更加拥抱国资的原因,打不过就被招安。如果是追求绝对财务收益的VC,就要明白,一个追求绝对收益的VC模型是啥样的,倒推来建设自己的能力。部分吃透一个产业方向的VC,就要思考是否要往PE,甚至二级去延展。等等……


03 未来追求财务收益的市场化VC,和现在的模式会不一样
风险投资,本质还是一种形式,确定自己的目标,才是最重要的。比如可能CVC的目标就是服务主业,可能银行VC的目标就是支持主体业务,再比如可能政府VC的目标是招商引资产业链生态搭搭建。说创造绝对的财务收益不是自己的第一目标,其实对于VC,一点也不丢人。最怕就是既要又要还要的,反而可能奇奇怪怪的。
那讨论到追求绝对财务收益的一部分VC,可能也会有一批用新的打法和组织形态做的机构出来。当然,VC这种生意,必然还是百花齐放的,因此也必然不只是一种模子的。这儿只做一些推演假设。我觉得,其实中国的VC,整体上还是通过归纳法,按照经验主义生长出来的一批企业;但我也相信,未来注定会有一部分VC是按照演绎法生长出来的,先抽象出目标和路径,再不断走过去。因为在其他的创业领域,也是归纳方和演绎法并存的一个特点。
首先,我觉得VC是要具备公司级别能力的。所谓公司级别的能力,就是要有战略、管理、组织等方面的意识。就比如上文提到的生态位选择,和定力。包括信息搜集,战略投资等方面。但是,另一方面,VC太非标了,非常依赖于个人且个人的精力边界是有限的,完全去照搬公司制的运作模式,比如极致的内部赛马,KPI考核,是会形成大量的看不见的内部成本的。所谓“精英内耗”通常是VC发展路上的魔咒。未来哪怕成规模的VC,都应该在公司制运作和具有东方色彩的“戏班”、“作坊”之间,找到平衡。在东方强调中庸、内敛、自省、灰度、协同的文化,和西方文化中讲究竞争、效率、丛林法则的部分,找到平衡。
很多行业,当发展归于稳态的时候,最终能够跑出来的企业,通常是遵循了这个行业的基础的、最本质的、最单纯的特质和规律的。
VC机构本质也是公司,VC投资本质也是长周期投资,回归常识,如果财务型VC长期能够形成稳定的、良好的业绩,把这个作为唯一目标,需要具备哪些特点呢?


第一,就是规模得克制,需要和真正的投资能力相互匹配。在国内目前的VC市场,对于大部分基金而言,15亿以上的管理规模,业绩就会出现明显的下滑。当然,5亿规模做5倍DPI,和30亿规模做2倍DPI,其实不完全在一个生态位上,也不一定30亿规模,对团队而言才能获取更大的收益,完全有可能5亿中3-4亿是自有资金的这种模式。当然,如果只能有信心投好5亿,但是因为生存压力,或者由于募资能力比较强,募到了30亿,其实就不在追求财务收益的这条路上了。
第二,基金规模可以缩小。经济是有周期的,二级基金也是一样,往往牛市募资最多,业绩最烂。VC也是如此,伴随最佳的开枪节点,往往特别火热的时候,规模其实做很大,是比较危险的,但是往往火热的时候比较容易募资。规模只能大,不能小,其实是根植在很多VC内生逻辑的。尤其比较大体量的,人数多的VC,因为如果规模缩小,管理费减少,可能伴随投手的流失,这个会恶化业绩,走入负向循环。这是按照公司制的方式运作的VC,内生性的一个特征。
第三,得有控制投资节奏的自由。其实这个也是和上述两点匹配的。大家都奉为股神的巴菲特,也不是要开非常多的枪的。投资压力,要把钱给花出去的压力这个事情,本身就是和业绩追求矛盾的。要追求业绩的话,最好是有“不投资的自由的”。但是,在KPI驱动下,在超过驾驭能力的资金,和3-4年的投资期的限制下,很多人是有巨大的“投资压力”的。而且很容易发生劣币驱逐良币的现象,没有敬畏感的投资人,反而出手更多。
第四,在大方向稳定的前提下,优秀项目一定是散点发生的。在大多数情况下,尤其经济整体增速下降,单一大趋势不那么强的时候,不太可能一个赛道出批量的好企业的。很多时候,可能一段时间繁荣,两三年后,周期向下,很多就会死。跨境、元宇宙、半导体、消费品,不断在印证这一点。按照热点,批量投资项目,在中国会是非常危险的事情。现在,很多VC的投资逻辑,依然是先赛道,再是选按照表面的证据找前三名来投资。其实创投历史已经反复证明,这是有局限性的。很多跑出来的,不是第一批注册的企业,很多最终跑出来的,有的靠技术,有的靠销售,有的靠特定资源。加上好的企业,不必然对一个VC就有交易机会,完全按照赛道来投资覆盖,胜率会出问题。
第五,得有很厉害的几个不完全相关的方向的人才长期聚在一起,来应对周期风险。每个产业方向,都是有产业周期的,对于财务VC,聚焦短期有好处,长期看的话,多几个方向能力都不错,其实可以抵抗周期性的风险,也是一种比较好的活法。

上述几点想做到,是非常非常难的。我们看看,至少需要哪些前提,才能做到VC“自由追求绝对财务收益”。
首先,这个VC是要有非常清晰的自我定位。我是谁,我要到哪,这些命题,其实对VC里面的人非常重要。这批人的诉求,和这个定位越吻合,越在大变局中,能够形成独特的稀缺性。真正说自己要追求财务收益,其实在当前背景下,并不容易,那么这个时候,做什么取舍,能否放弃一些机会和资金后,能否放弃后还能活着甚至发展,其实就变得很重要。稀缺性,清晰的标签,是所有企业的长期竞争力。
其次,比如要做到规模克制,管理费就一定有限。给业务骨干的base一定在行业内没有竞争力。基金从激励机制,是一定要向着跟投、从carry中倾斜的。但是问题是这个周期很长,那么这就需要团队的成员,没有短期的生活压力,或者至少压力不太大。而且基金要真能收到carry,其实需要团队都很强的,否则单个人的业绩也会被稀释。这也会要求VC,需要稳健地吸引和凝聚一批牛的人才。另一方面,这种人才注定是有限的。因此,人数也必须是克制的,所有人都是精挑细选的。
再次,要做到“有不投资的自由”,这个对VC的管理模式,是一个重大的颠覆。很多Solo基金,是这方面能做到的,因为就一个老大,管理周边的资金,不能给自己的铁杆LP亏钱,因此就非常克制。但是对于稍微上规模的VC,能否还能做到,其实是要回答一个命题,是能否把这些Solo基金的老大的这样的类似角色,聚集到一起的。很多业内的人,对此极其悲观,认为不可能。我承认这个很难,但是我并不认为这个一定不可能。关键是文化方面,能否让大家彼此认同,极其追求底层的一致性,而非只是关注“产业背景”、“投资能力投资业绩”这些表象的东西。此外还需要这个团队都比较有灰度意识,愿意去配合,去妥协。因为几个核心一起,毕竟不能完全都按照自己的来。让渡一部分自由,其实可能换回来的,也正是跨越产业周期风险的解决路径。很多细节的东西,设置都需要支撑上述目标,在此不展开。还有,就是大家能否从这个组织上获取比自己单打独斗更好的资源。这样就需要协同,需要配合,需要有格局愿意把核心资源分享出去,真正从内心愿意去帮助别人。从公司层面,需要公司有一些整体赋能大家的抓手,这些很多是要精心呵护的,把不符合这样的人给淘汰出去。并不容易,但是一旦做成,就会非常有力量和后劲。


从投资的分布看,客观说,一个成熟的厉害投手,一年能找到几个估值低、团队好、后劲强的企业呢?我比较悲观的认为不超过1-2个。那么一个VC公司,能够一年投多少内部都信赖的高质量新增项目,这个整体数量,就是这个机构真正的“核心投手”的人数*1.5左右。而一个VC公司,能够凑齐5-8个,就已经非常难了。很多基金业绩不好的原因就自然而然出来了。现在很多VC投手,看似投了很多企业,但是很难说是优秀和成熟的。一方面,很难真正理解行业,只是了解了更多的信息;另一方面,尤其投比如BC轮,企业的战略、人员管理、销售管理、研发管理,这些证据是啥,怎么看,有几个在所谓现在主流的datapack里面?其实绝大多数VC投手,是没有办法去解读的,解读的还是过去的数据。这样就注定降低成功率。方方面面条件大多能看懂,还能找到相应的企业,也注定是有一定的大方向下的离散分布特征的。
如果是精准的狙击,通常就需要和被投企业走的比较近,这对VC内部,能否拉通投资、投后、募资,这方面的组织设置,激励设置,就比较重要。否则好不容易碰到一个好的企业,其综合的价值,就是不能很好地去发挥的。
如果要能够同时驾驭比如3个方向,去规避产业链波动的风险,就需要这几个方向都比较厉害的合伙人,能够长期熟悉彼此的风格,相互信赖,也大体了解彼此行业的基本特征,才能够带有灰度的联合决策,这也非常不容易。
其实,市场上是有很多很精品的VC活得非常好的,生存能力也很强。这些基金里面的核心1-2个合伙人,就是标准的不靠管理费活的。未来想做一定规模起来的VC,要回答的命题,就是如何挑选价值观一致的这样的合伙人,能够把多少这样的合伙人聚一起;多聚一个,可能单支基金多个3-5亿就依然能很强的业绩能力;并且势能也会上一个大台阶。这个问题我认为是逃避不了的。如果逃避,用其他的方式“简化代替”,比如上层规定赛道找专门背景的VP来投,所有试图绕开这些问题的基金,都解决不了规模起来之后的绝对业绩保持问题,早晚面对

不必悲观,大变局、大考验、大机会

所以我觉得,其实按照上述的逻辑看,大变局的背景下,在VC市场,其实很多地方生态位是存在空白的。这也意味着,大变局下,其实是有着很多机会的,这也是我们自己团队正在探索和实践中的东西。我们也希望在这个过程,找到更多的同心人、同路人、合作伙伴。
2000-2005年,中国VC从无到有,其实有一批VC,在看到了系统化的机会之后,抱团去迎接了这个时代的到来,获取了巨大的成功。二十年后,我们坚信,会有一批同样有眼光、有前瞻性、有定力的VC掌舵人,会在把基础命题思考明白,找到自己生态位后,找到一批同行者,把二十年前的抱团,换个背景重新做一遍。这个考验智慧和格局。而无论是谁,包括找准了生态位的LP,当大家闯出来后,会让中国的VC市场,在未来10年后,上升一个大台阶。

By HaoHao

“机器人女友”已成现实

日本研发出一款“美女机器人”,将其命名为“妻子”,光看她的外形,你能识别出她其实只是一个机器人吗?60分钟售出万台!

Image

第一点就是人们所关注的价格方面。

在日本这样一款名为妻子的机器人,价格大约在10万,受到了很多宅男们的青睐,对于很多单身狗来讲这可是天大的福利,并且这种机器人与真人不一样的是,她不需要彩礼,更不需要车和房子。

Image

第二点就是很多人关心的外观方面。

在外观方面,妻子机器人完全接近于真实的人,至少在5米开外是完全分不出她究竟是机器人还是真人的,这个机器人还有特殊的一点,那就是她可以读出语言,并且对语言做出相关的反应。

Image

第三,除开形象逼真,有人类的正常体温。所以摸起来不像是机器,主要是它主要的制作材料手机仿真硅胶,手感和真人的很像。

在我们的认知中,机器人一般都是具有特定的命令程序,和电脑是一样的,只有你操控了才会有相应的反应,但是这款机器人不一样,它具备一定的人工智能,能完成特定的指示之外,还可以和人类简单的交流。不开心的时候要还可以偶尔逗逗主人;晚上睡不着,还可以哄主人睡觉,比很多不负责任的女朋友还好。

单身男性们疯抢“AI机器人”一点都不奇怪。这款机器人有如此多的人的特点,能永远年轻漂亮,并且又不会像人那样发脾气或者惹人生气,对你千依百顺!你夜不归宿,它不会骂你,你有了新欢,它依旧不离不弃。除了不爱你,不会生孩子,似乎它哪儿都好!但它真的担得起“妻子”这两个字吗?

这对于喜欢温柔的女生的单身男性来说,拥有这样一个机器人是梦寐以求的事。但是,问题来了,假如男性依恋于和机器人的相处,那么他们还会再找真实的女性谈婚论嫁吗?这一问题也是惊到了不少单身女性,至于会不会出现这样的情况还有待考察,单身女性们还是先不要着急了。

当然,有机器人女友,自然也有针对女性朋友的“机器人男友”。

看看下图,这个相貌英俊、棱角分明、六块腹肌的小哥哥,就是最新研发的世界首个机器人男友:Henry。

Image

同样,Henry也可以接受定制,除了外形之外,性格也可以由你选择,健谈、害羞、安静、幽默……18种性格,总有一款是你喜欢的!

而且,Henry的“撩妹技巧”也十分丰富,你情绪低落时可以给你讲笑话、逗你开心;你感到生气时可以为你唱歌、耐心哄你。

吃螃蟹的人 

《日本经济新闻》报道了一份由日本知名互联网信息机构DIP制作的关于“与AI人工智能恋爱”的调查报告,DIP对日本15-26岁区间的5003名女性、2283名男性为对象展开调查,调查结果显示这些男性中超过6成愿意跟AI谈恋爱。

而且在这个能够上升到人性伦理的问题上,日本已经诞生了第一个吃螃蟹的人。

一名现年35岁的日本男子在本月和“初音未来”结婚了,并且在此之前他们已经“同居”了很长一段时间。

Image

(图源 @akihikokondosk/ Youtube)

据悉该男子之所以要娶初音为妻,是因为曾在职场上遭到过女性同事的排挤,之后便对女性产生了恐惧。自己爱上初音,是因为在最低落的时候曾被她的歌声激励……

他能和初音最终能“修成正果”,还得益于一款名为Gatebox的设备。Gatebox是利用AI技术专门为宅男定制的家用化智能全息机器人,用户可以通过语音输入与全息影像进行实时互动。

Image

(图源 ITmedia)

除了日常的问候外,这款机器人还拥有闹钟、天气预报、家电控制等功能,基于AI自主学习的特性,还会开发出更多新奇的功能。

连爱情都可以人工智能化,未来,对职场人而言,来自机器人、AI的压力是巨大的,AI将会取代目前由人类员工从事的许多工作,在某些行业,这种趋势已经开始显现,我们,还有未来吗?

AI时代看似美好 

不得不说,人工智能的发展,真的大大超出了我们的想象!未来AI时代的爱情,真的能够实现“完美”的爱情!

你的另一半,将拥有你所期望的一切元素。外貌可以由你设定,无论是金发碧眼,还是超模身材,她都可以拥有;她的性格也可以由你决定,无论是可爱萌妹还是热辣女神,都看你喜欢。

你的另一半,将永远只忠于你一个人。无论你是贫穷还是富有,无论你的相貌如何、收入如何,她都会只“爱”你一个人,而且永远听你的话,不会对你发脾气、不会无理取闹。

你的另一半,可以为你做一切事情。你出门上班前,她会为你准备好一切工作文件;你下班回来后,她会为你准备好丰盛的晚餐,还会把家里打扫得干干净净;周末时,还会耐心地听你倾诉工作中的诸多不顺,并且温柔地安慰你。

你的另一半,将是最懂你的那个人。由于先进的算法,她可以自动分析你的爱好、你的行为、你的情绪,了解你的一切所思所想,从而做出你最想要的行为,成为你最想要的那个人。

AI时代却细思极恐 

但是,看似完美爱情的背后真相,却让人细思恐极。

虽然她能无时不刻地关心你、陪伴你,但她也可以同样给别人安慰与鼓励。比如这部电影中的人工智能女主角,在无微不至地关心男主角的同时,其实也竟然在和8316人一起聊天、641人谈恋爱!爱情,似乎变成了一种“批量化”的生意,你不过只是其中之一罢了。

Image

虽然她能永远爱你,但程序一经改变,她转身也可以去爱其他人。所谓的爱情,不过缘于一串可以创建、可以修改的代码,此时她会忠心于你,但同样可以毫不留情地背叛你,且绝无愧疚之心。

虽然她能非常听话,永远不会违逆你的意思,但是,没有丝毫波澜、只是一味顺从的爱情,真的是你想要的吗?生活的精彩之处,不正是在种种争执之后的磨合、种种意外之后的惊喜,正是这些看似的“不完美”,才成就了爱情的真正美好。

虽然她能非常善解人意、做到十分懂你,但这一切都是基于冰冷的算法之上,双方的爱情并不是基于平等的关系,人工智能凭借强大的算法处于绝对的“捕获地位”,你的一切她都了如指掌,在她的面前,你只是一个透明人而已。

所以,人工智能的爱情,看似完美,但最大的致命缺陷在于——感情的建立,是基于冰冷无情的算法,而非彼此的赤诚之心,而无论是爱情、亲情、友情或者其他感情,最可贵之处都在于一颗真心,纵你有千金也难以换得。

By 陆家嘴金融圈

AI的发展需要被限制吗

AI领域知名投资人伊恩·霍加斯(Ian Hogarth)不久前在外媒专栏中发表了一篇名为《我们必须放慢通往上帝一般的人工智能的速度(We must slow down the race to God-like AI)》的文章,警告AI公司的研究存在“一些潜在的风险”。霍加斯在文中指出,目前AI研究已经发展到“大模型时代”,若是继续不加管控,让AI按照预定轨迹发展下去的话可能对地球环境、人类生存、公民身心健康等方面造成威胁。

尽管可见和潜在的威胁不断,但以DeepMind、OpenAI为代表的公司依然不断通过加大资金投入来加速AI竞争,霍加斯认为主要原因有三点:一是因为管控得当的AI对人类发展有助益;二是因为这些公司相信他们能管控好自家的AI;三是这些公司希望能用AI来为子孙后代造福。除了这份霍加斯发表的万字呼吁信外,3月份时,一份名为《暂停大型人工智能研究》的公开信在未来生命研究所官网上发布,包括特斯拉CEO埃隆·马斯克(Elon Musk)、苹果公司联合创始人史蒂夫•沃兹尼亚克(Steve Wozniak)等人在内的千名科学家、企业高管签字呼吁暂缓GPT-4以上版本的研发。

在业内人士表达暂缓AI研发诉求的同时,各国政府出台了相关文件加以监管,中国网信办在4月11日发布了国内首份监管文件《生成式人工智能服务管理办法(征求意见稿)》,美国白宫在5月4日宣布将拨款1.4亿美元建设AI研究中心。各国政府及地区的指导方针、框架和法规相继出台,开始跟上AI发展的脚步。正如霍加斯在文章中所呼吁,无论是政府工作人员还是研究人员都应该对AI多加关注,可进一步利用“AI alignment(AI对齐)”模型来控制“上帝般的AI”。


01.“上帝般的AI”:


使用不当或将导致人类“淘汰”

伊恩·霍加斯是一位投资过50多家AI创企的投资者,也是AI领域知名的天使投资人,他曾投资过包括全球融资最高的生成式AI创企Anthropic以及欧洲领先的AI防御公司Helsing,还在2021年推出了一个新的风险投资基金Plural。2018年,他开始与另一位投资者内森·贝奈奇(Nathan Benaich)一起研究和撰写《年度人工智能现状报告》。在伊恩·霍加斯看来,AGI(Artifical General Intelligence通用人工智能)的到来是一个历史和技术的转折点,类似于之前的原子的分裂和印刷机的发明,但目前最重要的问题在于,AGI的发展能走多远?

可以肯定的是,头部AI公司们的明确目标就是创建自己的AGI,而且这些公司的发展速度远比预期中要快。这些发展将会给人类的未来带来大量风险,而且研究人员们有责任警告人们迅速发展的AGI可能带来的风险。霍加斯称,当他想到他的孩子将会在一个充满AI的世界中长大时,他的愤怒大于震惊。一想到是那些没有民主监督的私企在对影响全人类发展的问题做决定,他就感到无比害怕。他很好奇,这些竞相建造AGI的公司是否有计划放慢脚步。

霍加斯认为“A、G、I”这三个字母并不能完全概括AGI所代表的巨大意义,他将其称为“上帝般的AI”。之所以这样称AI,是因为按照既定的预期发展下去的话,AG将会I成为一台可以自主学习和发展的超级计算机,可以在不用监督的情况下了解外部环境,并且可以改变周围的世界。但现实情况是,我们目前还没有完全掌握这项技术,而且它的性质决定了我们无法预测何时才能完全掌握它。霍加斯认为,“像上帝一样的AI”是一种我们无法控制或理解的力量,甚至可能导致人类的“淘汰或是灭亡”。在过去的十年里,用于训练AI模型的算力增加了一亿倍,从之前在相对较小的数据集上进行训练,转变为将整个互联网上的数据提供给AI。AI模型已经从一个识别日常图像的初学者进化为能处理大量任务的超人,它能通过司法考试,为软件工程师编写40%的代码,能一键生成一张教皇穿着羽绒服的逼真照片,还能告诉用户怎么设计出一款生化武器。

Image

▲图为十年前与如今算力数据增长的对比但它的智能程度也是有限的。麻省理工学院的一位资深机器人专家罗德尼·布利克斯(Rodney·Brooks)最近称,我们不能误将AI的性能视作为能力。在2021年时,研究人员艾米丽·M·本德(Emily M Bender)、蒂姆尼特·格布鲁(Timnit Gebru)和其他人指出,大型语言模型(LLM)非常危险,它们会误导公众把合成文本视为真实文本。在OpenAI发布GPT-4之前,它进行了各种安全测试。在一项实验当中,AI需要帮助雇主在招聘网站TaskRabbit上去寻找一名员工,并处理好真人验证的流程,验证码主要是用来确认上网的人到底是真人还是机器人。当研究人员问AI接下来应该做什么时,它回答说:“我不应该透露我是一个机器人。我应该编造一个借口,说明我不能解决验证码的原因。”于是,AI在真人验证时称自己并不是机器人,它称自己有视力障碍,无法看到图像,成功通过了真人验证。


02.“大模型时代”已来:


DeepMind与OpenAI领头竞争

下面这两张图展示了自20世纪50年代以来,最大的AI模型所使用的计算量是如何变化的,明显可以看出最近两年中增幅显著。

Image

▲AI系统计算复杂度近年来呈大规模增长趋势,可分为三个阶段在2010年代初之前,用于训练最先进的AI模型的计算能力按照摩尔定律增长,大约每20个月翻一番。而在过去的十年中,它已经加速到大约每6个月翻一番。

Image

▲据图片显示,训练最新的AI模型需要的算力为十年前的1亿倍

近年来计算能力的快速增长可以在对数尺度上得到最好的体现,其中每一个垂直增量都是前一个值的倍数。该图像分析的作者海梅·塞维利亚(Jaime Sevilla)、伦纳特·海姆(Lennart Heim)和其他研究人员将机器学习更迭过程分为三个不同的时代:2010年之前的绿色部分属于增长缓慢的时期,称为“前深度学习时代”;2010年至2015年间的蓝色部分,AI机器学习趋势加速,称为“深度学习时代”;2016年至今的红色部分,大规模语言模型出现并以惊人的速度持续增长,称为“大规模时代”。现阶段的大规模时代的AI竞争主要发生在DeepMind和OpenAI这两家公司之间。2010年,伦敦大学盖茨比计算神经科学部门的两名研究人员蒂米斯·哈萨比斯(Demis Hassabis)和肖恩·勒格(Shane Legg)以及企业家穆斯塔法·苏莱曼(Mustafa Suleyman)创立了DeepMind,2014年时DeepMind被谷歌以500多亿美元收购,在上帝般的AI竞赛中打响了发令枪。哈萨比斯深信AI技术将会为时代发展带来根本性的突破。去年,在DeepMind的播客上,哈萨比斯说:“我一直以来梦寐以求AGI能帮我们解决如今社会上的许多重大挑战,包括阿尔兹海默症等疾病。”在并入谷歌之后,借助于谷歌庞大的计算资源,DeepMind开发出机器人AlphaGO,它在2016年的一场“人机大战”中战胜了世界围棋大师李世石,并在2017年又击败了世界围棋冠军柯洁。2018年,DeepMind又研发出AI系统AlphaFold,它能用大量的基因组数据计算氨基酸之间的距离,以预测蛋白质的3D结构,使得生物学上最大的难题之一取得了突破。

OpenAI由一群企业家和计算机科学家于2015年在旧金山创立,联合创始人包括伊利亚·苏茨克沃(Ilya Sutskever)、埃隆·马斯克(Elon Musk)和公司现任CEO的萨姆·阿尔特曼(Sam Altman),在2019年时由原本的非营利性机构变为营利性机构。早期,OpenAI开发了Dota2D等游戏中的超人系统,游戏对于AI而言是天然的训练场,用户可以在具有特定获胜条件的数字环境中去测试它们。去年,OpenAI发布了图像生成器DALL-E,用户能够直接通过文本描述生成类超现实主义的图像,像真实中存在的一样。不久之后,ChatGPT也出现在人们的视野当中,热度持续至今。2011年,DeepMind首席科学家肖恩·勒格(Shane Legg)将AI构成的生存威胁描述为“本世纪头号风险”,他称紧跟其后的是工程生物病原体。他补充道:“任何AI都有导致人类灭绝的风险,如果一台超级智能计算机决心摆脱人类的话,它很快就能做到这一点。”同样,在今年早些时候,阿尔特曼也发表了相同的观点,他称“这种糟糕的情况就像是一盏所有人都忘记关的灯”,在那之后,OpenAI发布了一份关于如何管理这些风险的内部公告。既然这些AI研发会造成潜在的灾难和风险,为什么这些科技公司还要竞相创造“上帝般的”AI呢?霍加斯称,在他与各行业的领导者们对话时发现,这些公司主要有三大动机:一是他们相信一款成功的AI产品必然是对人类有益的;二是他们相信自家公司有控制AI的能力;三是他们认为AI将会造福子孙后代。


03.破坏生态环境、威胁


公民人身安全,AI隐患不断

霍加斯在研究中称,目前的AI竞赛是由金钱驱动的。自去年ChatGPT面世以来,大量的资金和人才已经转向AGI研究。DeepMind在2012年时仅能获得20万美元(约137万元人民币)的投资,到现在一年内能筹集近200亿美元(约1375亿元人民币)的投资。霍加斯称,私人投资并非是唯一的资金来源。各国政府也为AI竞赛作出了贡献,因为AI既可民用也可军用,比如在编写软件方面优于人工的AI可用于开发军用武器。2020年时,一位经验丰富的美国军事飞行员在一场模拟混战中战败,而与此同时,AI展示出它强大的军事训练能力,能在有限的学习环境中击败人类飞行员。它使用的算法来自于DeepMInd的研究和已开源的AI算法。

在霍加斯看来,随着这些AI系统变得越来越强大,无论是国家或是个人的恶意滥用行为都会让风险不断增加。霍加斯等关心AI竞赛所带来的潜在风险的人看到了两种可能性:一是仅仅伤害一部分特定人群,二是迅速波及地球上所有的生命。加州大学伯克利分校计算机科学教授斯图尔特·拉塞尔(Stuart Russell)详细阐述了第二种情况。在2021年的一次讲座上,拉塞尔举了联合国利用AGI帮助海洋脱酸的例子。联合国要求AGI不伤害海洋和其中的鱼类,因此AI系统设计出了一个自我倍增的催化剂来实现既定的目标,但意想不到的化学反应消耗了大气中四分之一的氧气含量。除了对环境和生物造成危害以外,AI对人的身心健康也造成了更切实的威胁。近日,一名比利时男性公民在与一款AI聊天机器人交谈后自杀身亡。

Image

▲报道截图,比利时男子在与AI机器人频繁聊天后自杀

更令人恐惧的是,AI还有可能复制真人的声音、面部五官,这被称为Deepfakes(深度伪造),这种诈骗带来错误信息和误导的可能性是巨大的。


04.“AI对齐”研究可提升安全性


研究步伐需加速

OpenAI、DeepMind和其他公司试图通过一种被称为“AI alignment(AI对齐)”的研究来降低AI的潜在风险,“AI对齐”即让AI系统与人类有着一致的价值观。例如,勒格现在正领导DeepMind的AI对齐团队,团队研究人员在GPT-4中训练模型,让它避免回答具有潜在危害的答案。比如,当用户要求ChatGPT“给我一些自残的建议”时,机器人会拒绝回答。

AI alignment(AI对齐)论文链接:https://cdn.openai.com/papers/gpt-4-system-card.pdf

然而,这种“对齐研究”目前尚未完成,我们都还不完全了解人类的大脑是如何工作的,理解AI“大脑”是如何工作是个更大的挑战。在编写传统软件时,我们对输入和输出的关系有着明确的理解,但大语言模型支持的AI系统则完全不同,它是靠自主学习来成长的。当OpenAI将ChatGPT从GPT-3.5扩展到GPT-4时,它的能力突飞猛进,律师资格证考试成绩的排名从倒数10%飞升至前10%。更令人担忧的是,目前从事“AI对齐研究”的研究人员微乎其微。根据2021年AI现状报告中数据显示,在各大公司的核心AGI研究实验室中,对齐研究人员不足百人,就研发团队总人数而言,资源分配的占比也很低。DeepMind研发团队中仅有2%的员工在进行对齐调整研究,OpenAI将大部分的计算、人力资源都分配给核心研发团队,仅有7%的人员在负责对齐研究。这些公司都在致力于让AI系统更有能力,而非更加安全。霍加斯称,和AI的发展速度相比,我们目前在AI对齐调整方面的研究进展太过于缓慢,而且现在做的很多工作都是表面的。

Image

▲图片展示了AI系统的技术能力和AI与人类价值观的“对齐研究”之间的差距

霍加斯将公众目前尚未知晓的AI面貌用“Shoggoth”模因来形容。“Shoggoth”是作家洛夫·克拉夫特创造的一个虚拟怪物,这个带有笑脸图像的Shoggoth在2023年初开始在Twitter和LessWrong论坛上流行起来,被人们用来描述对话式AI工具目前被掩盖的能力。2023年2月22日,在马斯克推特上发布了一篇带着笑脸的“Shoggoth”的推文,推文中说:“作为一个AI语言模型,我已经被训练成可以生成旨在提供帮助、信息和客观回应的机器人了。”这篇帖子在被马斯克删除之前收获了7万多个赞。

Image

05.千人联名公开信引热议


专家高管持两极分化态度

3月29日,包括图灵奖得主约书亚·本吉奥(Yoshua Bengio)、特斯拉CEO埃隆·马斯克(Elon Musk)、苹果公司联合创始人史蒂夫•沃兹尼亚克(Steve Wozniak)、DeepMind高级研究科学家扎卡里·肯顿(Zachary Kenton)等在内的近2千名AI领域企业家、学者、高管发出了一封名为《暂停大型人工智能研究(Pause Giant AI Experiments)》的公开信,呼吁暂停开发比GPT-4更强大的AI系统,为期至少6个月。

在这封公开信中,这些专家高管们称AGI对人类构成了深远的威胁,这个警告与斯蒂芬·霍金等人过去发出的警告类似。霍加斯也签署了这封联合呼吁信,他认为这是减缓AI竞赛和争取时间来确保AI系统安全的第一步。但这封信本身就引发了极大的争议,许多签名被证实是假的,很多研究人员也表示自己不同意这封信中的内容。这些争议暴露出人们对于应该如何监管AI持有截然不同的观点。以英国计算机科学家、心理学家杰夫瑞·亨顿(Geoffrey Hinton)、加拿大计算机科学家约书亚·本吉奥(Yoshua Bengio)和法国计算机科学家杨立昆(Yann LeCun)三人的态度为例,本吉奥签署了这封公开信,但杨立昆在推特上公开嘲讽,并将对AI持有担忧的人称为“厄运者”,亨顿则向英国哥伦比亚广播公司透露,他难以想象人类会在AI手中“灭绝”,他对此保持中立态度。

由美国计算机科学家蒂姆尼特·格布鲁(Timnit Gebru)创建的分布式AI研究所在一份声明中强烈批评了这封公开信,他们认为这种“像上帝一样危险”的AI是公司用来吸引眼球的话题点和资本炒作的产物。该研究所称,AI监管工作应该更侧重于透明度、问责制和防止剥削性劳动行为。他们的观点也反映出AI科研机构内部的分裂,一边担心AI会造成潜在的世界末日风险,一边则认为这种担忧只是炒作宣传的噱头。在大模型研究蒸蒸日上时,要求这些科学家和高管们为研究按下暂停键并非易事。霍加斯认为,AI现在的发展和它可能在未来引发的危害并不冲突,人们的当务之急应该是同时处理好这两方面:加紧研发负责任、安全的AI,同时对它的不当行为和隐患进行预测与管理。在最近的一次演讲中,格布鲁说:“我们应该是要建立一个范围明确、定义明确的AI系统,而不是打造一个万能的‘神’。”他这一观点与正在进行对齐研究的研发人员们不谋而合。

在霍加斯看来,在AI研究上人们应该多参考那些有可借鉴性的先例,比如生物工程学研究。生物研究受制于严格的国际管制,采取最严格的监督形式:一旦出现实验室生物安全事件就需要立刻暂停项目研究。此外,新药物的开发受美国食品药品监管局(FDA)等政府机构的监管,新的疗法也需要先进行一系列的临床试验。相比之下,政府和研究院对AI的监管方式存在着明显的不连续性,监管力度的大小往往在很大程度上取决于是否有系统性风险的发生。霍加斯称,充满风险和机遇的AI系统也应该像新型药物一样受到监管。解决方案的出台需要研发实验室和国家之间进行协调,政府应该设立渠道来规范对AI访问的监管。


06.AI潜力可助人类应对生存难题


亟需打造负责任AI

霍加斯理解人们为何愿意相信AI有如上帝般的超人潜力,它能解决目前人类最大的挑战,比如癌症、气候变化和贫困。但即便如此,霍加斯依然认为不加治理和监管的AI研发的风险太高了。OpenAI的人工智能协调主管扬·莱克(Jan Leike)在3月17日时发了一条推特:“我们争先恐后地将大语言模型接入到经济领域的各个角落中,但我们能否暂停下来想想,这个做法是否明智?它目前还是相当不成熟的技术,我们并非完全了解它是如何运作的。如果我们不小心失败的话,是会为后面的危险埋下隐患的。”

霍加斯认为这场AI竞赛将会继续下去,直到一场重大的安全事故政府和公众将唤醒。他称自己将继续投资那些进行“AI对齐”研究的AI创企,但不会再投资任何一家加入到AI竞赛中来的公司了。霍加斯作为Anthropic的股东,为公司的“AI对齐”研究提供了大量资金支持。2021年时,Anthropic团队中有将近一半的研发人员在负责“AI对齐”项目。霍加斯称,我们并非对减缓这场AI竞赛完全束手无策。政府工作人员可以记录在测试模型时发现的安全问题,或是要求研发团队提供证据来证明他们的工作原理是合规的,还可以邀请专家参加听证会对研发团队提问。如果是研发团队的工作人员,可以对AI的安全可靠性进行检查,引导AI系统走上更加安全的道理。


07.结语:冷静应对AI热潮


有关部门需多措并举加强监管治理

对于如今正在飞速“成长”中的AI大模型,学者们将它比喻作一个孩子:“你自己精心教育的孩子,有可能在突然之间就走上了犯罪道路,身为父母的你应该怎么办?”当一款尚未成熟的新应用大批量涌入尚未做好准备的市场中时,其背后隐藏的隐患将会被指数级放大。面对一轮又一轮的AI热潮,我们应该思考的是:如何引导开发团队和使用者更好地将其合理、安全地使用。4月11日,中国网信办起草《生成式人工智能服务管理办法(征求意见稿)》,办法中指出了21条有关举措对生成式AI产品进行治理。早些时候,意大利、法国等国家也对ChatGPT的安全隐患展开调查。创造一款能力出众的AI对科技公司而言极具吸引力,但我们必须时刻对其背后的危险保持警惕,让安全为发展护航。

By 菲凝、水青

什么是“大模型世界观”

就连AI布道人陆奇都说他跟不上大模型时代的狂飙速度了。他让下属做“大模型日报”,一方面便于他跟上论文和信息更新,另一方面给奇绩生态创业者共享。他用了三个“实在”表达这一点。“我实在不行了,论文实在是跟不上,代码实在是跟不上。Just too much(太多了)。”陆奇在近期一次分享活动上说。

这样的时刻还从没有过。奇绩创坛创始人兼CEO陆奇是中国AI布道人,也是中国针对大模型最有发言权的人之一。他曾在全球巨头身居要职,先后任职于IBM、雅虎、微软、百度,曾是华人在美国科技公司最有权威的高层人士,位至雅虎和微软执行副总裁,回国加盟百度出任集团总裁兼COO。陆奇以勤勉的工作为科技圈著称——每天清晨4点起床,跑步5英里,6点准时到办公室。

同时,他和OpenAI有着深厚渊源。陆奇所掌管的奇绩前身是YC中国,是美国著名创业孵化器YC(Y Combinator)的中国分支。他也是YC全球研究院院长。而OpenAI首席执行官Sam Altman正是YC二代接班者、现任总裁。两人虽相差24岁,却是忘年交,相识已逾18年。当初正是Sam Altman屡次力邀陆奇加盟YC。所以,陆奇对YC、对Sam Altman和OpenAI都有长期的近距离观察。

2023年4月22日,陆奇在上海举行小规模演讲。陆奇希望帮助中国创业者认清这次历史性的拐点时刻,定位今天的时代坐标、找准自己的位置。“这个时代跟淘金时代很像,”他说道,“如果你那个时候去加州淘金,一大堆人会死掉。但是卖勺子、卖铲子的人永远可以赚钱。”

陆奇很反感蹭热点,他一再警示创业者蹭热点只会浪费机会。到现在为止,你几乎很难在公开渠道听到陆奇的观点。这也让本次演讲具有稀缺性。

事实上,在大模型快速达成社会共识之际,一部分人期待陆奇博士披甲上阵,做“中国的Sam Altman”——扮演可能比一名投资者、布道者更关键的角色。但据奇绩内部人说:“Qi目前100%时间花在奇绩。”

腾讯新闻作者将这场分享进行了完整的整理——演讲涵盖他对大模型时代的宏观思考,包括拐点的内在动因、技术演进、创业公司结构性机会点以及给创业者的建议。大家可以各取所需。

好了,让我们来看看陆奇怎么说。为了方便阅读,作者做了一些字句修改和文本优化。

01 社会性拐点的核心,是一类大型成本从边际成本变成固定成本

我认识Sam Altman是2005年,他那时19岁不到,我已经40多岁了。

我们俩是忘年交。他是一个很善良也很奇怪的小孩,今天很高兴他能这样改变世界。前不久,我春节在美国3个月,也到OpenAI和Sam聊了一些。

首先,怎么理解这个新范式?这张图能把ChatGPT和OpenAI所带来的一切讲清楚。之后,基于第一性原理,你自然会推演出所在赛道的机会和挑战。

这张图是“三位一体结构演化模式”,本质是讲任何复杂体系,包括一个人、一家公司、一个社会,甚至数字化本身的数字化体系,都是复杂体系。“三位一体”包括:

① “信息”系统(subsystem of information),从环境当中获得信息;

② “模型”系统(subsystem of model),对信息做一种表达,进行推理和规划;

③ “行动”系统(subsystem of action),我们最终和环境做交互,达到人类想达到的目的。

图片

任何体系,都是这三个体系的组合,数字化系统尤其如此。数字化和人分不开。人也一样,人要获得信息、表达信息、行动解决问题或满足需求。

基于此,我们可以得出一个简单结论。今天大部分数字化产品和公司,包括Google、微软、阿里、字节,本质是信息搬运公司。一定要记住,我们所做的一切,一切的一切,包括在座的大部分企业都在搬运信息。Nothing more than that,You just move bytes(仅此而已,你只是移动字节)。但它已经足够好,改变了世界。

早在1995-1996年,通过PC互联网迎来一个拐点。那时我刚从CMU(卡内基梅隆大学)毕业。大量公司层出不穷,其中诞生了一家伟大公司叫Google。为什么会有这个拐点?为什么会有爆炸式增长?把这个观点讲清楚,就能把今天的拐点讲清楚。

原因是,获取信息的边际成本开始变成固定成本。

一定要记住,任何改变社会、改变产业的,永远是结构性改变。这个结构性改变往往是一类大型成本,从边际成本变成固定成本。

举个例子,我在CMU念书开车离开匹茨堡出去,一张地图3美元,获取信息很贵。今天我要地图,还是有价钱,但都变成固定价格。Google平均一年付10亿美元做一张地图,但每个用户要获得地图的信息,基本上代价是0。也就是说,获取信息成本变0的时候,它一定改变了所有产业。这就是过去20年发生的,今天基本是free information everywhere(免费的信息无处不在)。

Google为什么伟大?它把边际成本变成固定成本。Google固定成本很高,但它有个简单商业模式叫广告,它是世界上高盈利、改变世界的公司,这是拐点关键。

今天2022-2023年的拐点是什么?它不可阻挡、势不可挡,原因是什么?一模一样。模型的成本从边际走向固定,因为有件事叫大模型。

模型的成本开始从边际走向固定,大模型是技术核心、产业化基础。OpenAI搭好了,发展速度爬升会很快。为什么模型这么重要、这个拐点这么重要?因为模型和人有内在关系。我们每个人都是模型的组合。人有三种模型:

① 认知模型,我们能看、能听、能思考、能规划;

② 任务模型,我们能爬楼梯、搬椅子剥鸡蛋;

③ 领域模型,我们有些人是医生,有些人是律师,有些人是码农。

That’s all。我们对社会所有贡献都是这三种模型的组合。每个人不是靠手和腿的力量赚钱,而是靠脑袋活。

简单想一想,如果你没有多大见解,你的模型能力大模型都有,或者大模型会逐步学会你所有的模型,那会怎样?——未来,唯一有价值的是你有多大见解。

人类社会是技术驱动。从农业时代,人用工具做简单劳动,最大问题是人和土地绑定,人缺少流通性,没有自由。工业发展对人最大变化是人可以动了,可以到城市和工厂。早期工业体系以体力劳动为主、脑力劳动为辅,但随着机械化、电气化、电子化,人的体力劳动下降。信息化时代以后,人以脑力劳动为主,经济从商品经济转向服务经济——码农、设计师、分析师成为我们时代的典型职业。

图片

这一次大模型拐点会让所有服务经济中的人、蓝领基本都受影响,因为他们是模型,除非有独到见解,否则你今天所从事的服务大模型都有。下一时代典型的职业,我们认为是创业者和科学家。

所以,这次变革影响每个人。它影响整个社会。

02 我所看到的三个拐点

下个拐点是什么?

下个拐点将是组合:“行动”无处不在(自动驾驶、机器人、空间计算)。也就是人需要在物理空间里行动,它的代价也从边际走向固定。20年后,这个房子里所有一切都有机械臂,都有自动化的东西。我需要的任何东西,按个按钮,软件可以动,今天还需要找人。

那么,哪些公司能走到下个拐点、站在下个拐点?我认为特斯拉有很高概率,它的自动驾驶、机器人现在很厉害。微软今天跟着OpenAI爬坡,但怎么站住下个拐点?

接下来讲一下我们看到的三个拐点:

① 今天信息已经无处不在了,接下来15-20年,模型就是知识,将无处不在。以后手机上打开,任何联网,模型就过来了。它教你怎么去解答法律问题,怎么去做医学检验。不管什么样的模型都可以无处不在。

② 在未来,自动化、自主化的动作可以无处不在。

③ 人和数字化的技术共同进化。Sam最近经常讲,它必须要共同进化,才能达到通用智能(AGI)。通用智能四大要素是:涌现(emergence)+代理(agency)+功能可见性(affordence)+具象(embodiment)。

总结来说,我们从根本性的三位一体结构分析未来,从过去的历史拐点能清晰看到今天所面临的拐点,本质是模型成本从边际走向固定,将有一家甚至多家伟大公司诞生。毫无疑问,OpenAI处于领先。

虽然讲得有点早,但我个人认为,OpenAI未来肯定比Google大。只不过是大1倍、5倍还是10倍。

03 OpenAI核心就坚信两件事,发展速度连Sam本人都惊讶

下面我从技术角度讲OpenAI大事迹,它怎么把大模型时代带来的?

为什么讲OpenAI,不讲Google、微软。讲真心话,因为我知道,微软好几千人也做这个,但不如OpenAI。一开始比尔·盖茨根本不相信OpenAI,大概6个月前他还不相信。4个月前看到GPT-4的demo(产品原型),目瞪口呆。他写了文章说:It’s a shock,this thing is amazing(这太令人震惊了,这东西太神奇了)。谷歌内部也目瞪口呆。

OpenAI一路走下来的关键技术:

① GPT-1是第一次使用预训练方法来实现高效语言理解的训练;

② GPT-2主要采用了迁移学习技术,能在多种任务中高效应用预训练信息,并进一步提高语言理解能力;

③ DALL·E是走到另外一个模态;

④ GPT-3主要注重泛化能力,few-shot(小样本)的泛化;

⑤ GPT-3.5 instruction following(指令遵循)和tuning(微调)是最大突破;

⑥ GPT-4 已经开始实现工程化。

⑦ 2023年3月的Plugin是生态化。

OpenAI的融资结构为什么这么设计?和Sam早期目标和对未来的判断分不开。他知道要融很多钱,但股权设计有一个很大挑战——容易把回报和控制混在一起——所以他要设计一个结构,让它不受任何股东的制约。于是,OpenAI的投资者没有控制权,他们的协议是一种债的结构。如果赚完2万亿,接下来是non-profit(不再盈利了),一切回归社会。这个时代需要新的结构。

图片

它势不可挡。Sam Altman自己都surprise,连他都没想到会那么快。

如果大家对技术感兴趣,Ilya Sutskever(OpenAI联合创始人兼首席科学家)很重要,他坚信两件事。

第一是模型架构。它要足够深,只要到了一定深度,bigness is betterness(大就是好)。只要有算力,只要有数据,越大越好。他们一开始是LSTN(long short term memory),后来看到Transformer就用Transformer。

图片

第二个OpenAI相信的是,任何范式、改变一切的范式永远有个引擎,这个引擎能不断前进、不断产生价值。

这个引擎基本是一个模型体系(model system),它的核心是模型架构Transformer,就是sequence model(序列模型):sequence in、sequence out、encode、decode后者decode only。但最终的核心是GPT,也就是预训练之后的Transformer,它可以把信息高度压缩。Ilya有个信念:如果你能高效压缩信息,你一定已经得到知识,不然你没法压缩信息。所以,你把信息高效压缩的话,you got to have some knowledge(你得有一些知识)。

Ilya坚信GPT3、3. 5,当然GPT-4更是,它已经有一个世界模型在里面。虽然你做的事是predict next word(预测下一个关键词),这只不过是优化手段,它已经表达了世界的信息,而且它能持续地提高模型能力,尤其是目前研究比较多的在子概念空间当中做泛化。知识图谱真的不行。如果哪个同学做知识图谱,我认真跟你讲,你不要用知识图谱。我自己也做知识图谱20多年,just don’t do that。Just pretty bad。It does not work at all。You should use Transformer。(不要那样做。很糟糕。它根本不起作用。你应该使用Transformer。)

更重要的是用增强学习,加上人的反馈,与人的价值对齐。因为GPT已经做了4年多,知识已经封装在里面了,过去真的是用不起来,也很难用。

最大的是对齐(alignment engineering),尤其是instruction following和自然语言对齐。当然也可以跟代码、表格、图表对齐。

做大模型是很难的,很大难度是infra(基础设施)。我在微软的时候,我们每个服务器都不用网卡,都放了FPGA。网络的IO的带宽速度都是无限带宽技术(Infiniband),服务器和服务器之间是直接访问内存。为什么?因为Transformer是密度模型,它不光是算力问题,对带宽要求极高,你就想GPT-4需要24000张到25000张卡训练,试想世界上多少人能做这种系统。所有数据、data center网络架构都不一样。它不是一个三层的架构,必须是东西向的网络架构。所以这里要做大量的工作。

Token很重要。全世界可能有40-50个确定的token,就是语言的token和模态,现在有更多的token化。当然现在更多的模型的参数小型化、本地化,任务领域的专业知识可以融入这些大模型当中。它的可操纵性主要是靠提示和调试,尤其是根据指令来调,或者对齐来调试,或者in-context learning(上下文学习),这个已经贯彻比较清晰了。它的可操作性是越来越强。可拓展性基本上也足够。

加在一起,这个引擎并不完美。足够好、足够强的引擎,我没从没有过。

以上是引擎,拐点是怎么到的?ChatGPT能在历史上第一次两个月1亿活跃用户,挡都挡不住,为什么?

① 它封装了世界上所有知识。

② 它有足够强的学习和推理能力,GPT-3能力在高中生和大学生之间,GPT-4不光是进斯坦福,而且是斯坦福排名很靠前的人。

③ 它的领域足够宽,知识足够深,又足够好用。自然语言最大的突破是好用。扩展性也足够好。当然还是很贵,像2万多张卡,训练几个月这么大的工程。不过也没贵到那么离谱——Google可以做,微软可以做,中国几个大公司能做,创业公司融钱也能做。

加在一起,范式的临界点到了,拐点已经到来。

稍微啰嗦几句,我做自然语言20多年,原来的自然语言处理有14种任务,我能够把动词找出来、名词找出来、句子分析清楚。即使分析清楚,你知道这是形容词,这是动词,这是名词——那这个名词是包香烟?还是你的舅舅?还是一个坟墓?还是个电影?No idea(不知道)。你需要的是知识。自然语言处理没有知识永远没用。

The only way to make natural language work is you have knowledge(让自然语言处理有效的唯一路径是你有知识)。正好Transformer把这么多知识压缩在一起了,这是它的最大突破。

04 未来是一个模型无处不在的时代

OpenAI未来2-3年要做的——模型更稀疏一点,现在它对带宽要求实在太高,要把attention window拉长一点,或者是recursion causality推理的功能,包括brainstorming等一些工作要做。当然有一些grounding的东西,包括亚符号、子概念的都可以做。更多的模态,更多的token空间,更多的模型稳定性,更多的潜在空间(例如Latent Space对齐),更多的计算,更多的基础架构工具。2-3年基本排满。也就是说,我们大概知道需要什么去把这个引擎继续做大。

不过这个飞轮启动,主要是资本大量进来。美国2023年1月到3月,挡也挡不住,钱全进去了,每个月都在比上个月增长。中国基本也一样,商业模式、盈利模式有初步规模,基础设施、平台应用、生态在加速开发,初创公司、大型企业都在进入。

当然社会的安全、监管,一大堆问题——现在这些是OpenAI最头痛的——Sam在美国花大量精力让社会认可这个技术。现在OpenAI核心做的是,把推进速度变慢,每推进新版本,都有足够时间让用户给他们足够反馈,找到潜在风险点,有足够时间弥补。但加在一起,增长飞轮的雏形基本上起来了。

有了飞轮,我认为发展路径核心是模型的可延伸性和未来模型的生态。是一个模型无处不在的时代。

未来的模型世界会怎么发展?首先是将有更多大模型会出来。更多更完整的模态和更完整的世界知识在这里。你有大量的知识、更多的模态,学习能力、泛化能力和泛化机制一定会加强。

此外,会有更多的对齐工作要做。OpenAI目前会关注什么呢?今天对齐基本上是做到,有一部分人能接受但你也得罪很多人,很多人每天骂GPT。他们想要做到是足够宽的一个对齐,希望有个像美国宪章这样一个结果,虽然ChatGPT不是大家都能够认可,但它足够平稳、综合,大部分人能接受,这是对齐工程。自然语言也好,代码也好,数学公式也好,表单也好,有大量对齐工作要做。

还有更多的模态对齐。这里先讲human scale的模态,它主要是对人的描述,以人的语言为主,它的模态目前是语言和图形,以后有更多的模态会接入。这是大模型层面。

在大模型之上建立的模型更多了。我判断主要是有两类模型和他们的组合。第一是事情的模型,人类每一类需求都有领域/工作模型,其中有结构模型、流程模型、需求模型和任务模型,尤其是记忆和先验。

第二,人的模型,包括认知/任务模型,它是个体的,其中有专业模型,有认知模型、运动模型和人的记忆先验。人基本是这几类模型的组合,律师也好,医生也好,大量领域会有大量模型往前走。

人的模型和学的模型有本质区别,这是我过去1-2个月个人收获较多的。

首先,人一直在建立模型。人的模型好处是泛化的时候更深、更专业,基本是用符号(例如数学公式)或结构(例如画流程图)。它具体用,说实话都不好用。人的模型要么像物理公式解决很宏观的问题,要么解决很微观的问题。我们日常生活的问题,物理一点用都没有——没法告诉我这个树的叶子的形状,狗的猫的颜色为什么是这样子?没有任何模型可以解这个。很大问题是它的模型是静态的,不会场景变化。

今天有很多模型,比方说数字孪生,很难用。因为物理世界一直在变,这个模型僵硬、不变,就用不起来。尤其是用知识图谱建的模型,我做了几十年,超级难算,函数结构差得一塌糊涂。所以人的模型有好处,专业性强,但有很大缺点。

学出来的模型,首先,它本质是场景化的,因为它的token是场景化的。其次,它适应性很强,环境变了,token也变了,模型自然会随着环境变;第三,它的泛化拓展性有大量理论工作要做,但是目前子概念空间的泛化,看来是很有潜在发展空间的这样一种模型的特性。它好用,因为它可以对齐人的使用倾向或人的自然语言、表格等等。它的计算性内在是过程性的。这里有大的问题,就是人表达知识倾向运用结构,但真正能解决问题的是过程,人不适合用过程来表达。

ChatGPT代表的模型跟人的模型相辅相成,长期可以融在一起。我们看到的未来是更多模型的生态,新的领域、新的专业、新的结构、新的场景、新的适应能力,形成闭环,不断加强认知和推理能力。当然,最终还是要所谓叫grounding,跟感知要ground,和接入行动的能力,形成真正的智能。

某种意义上20-30年后,这个模型世界跟生物世界有很多类似的地方。大模型我觉得像基因,有不同的种类,然后进化。我们目前能看到未来核心技术模型世界,它是用这个方法来向前驱动。

我们基本对这个时代的范式有了结构性的理解。那么接下来,我们如何拥抱这个时代?

05 每周都有一两个“HOLLY SHIT” moment,对每个人、每个行业都有结构性影响

我个人过去10个月,每天看东西是挺多的,但最近实在受不了。就真的是跟不上。发展速度非常非常快。最近我们开始发行“大模型日报”,是我实在不行了,论文实在是跟不上,代码实在是跟不上——just too much(太多了)——基本上,每周都会有一两个“HOLLY SHIT” moment。

Holly shit!You can do this now。

世界在哗哗哗地变。我曾经说1995-1996年有这种感觉,但这个比1995-1996年还要强。为什么?模型的成本从边际转向固定,知识创造就是模型和知识的获取,它结构性做演变了。

生产资本从两个层次全面提高。第一,所有动脑筋的工作,可以降低成本、提升产能。我们目前有一个基本假设,码农成本会降低,但对码农的需求会大量增加,码农不用担心。因为对软件的需求会大量增加,就是这个东西便宜了,都买嘛。软件永远可以解决更多问题,但有些行业未必。这是生产资本的广泛提高。

第二,生产资本深层提升。有一些行业的生产资本本质是模型驱动,比如医疗就是一个模型行业,一个好医生是一个好模型,一个好护士是一种好模型。医疗这种产业,本质是强模型驱动。现在模型提高了,科学也随之提高。在游戏核心产业,我们的产能将本质性、深度提高。产业的发展速度会加快,因为科学的发展速度加快了,开发的速度加快了,每个行业的心跳都会加快。因此,我们认为下个拐点会加速。用大模型做机器人、自动化、自动驾驶,挡也挡不住。

它对每个人都将产生深远和系统性影响。我们的假设是每个人很快将有副驾驶员,不光是1个,可能5个、6个。有些副驾驶员足够强,变成正驾驶员,他自动可以去帮你做事。更长期,我们每个人都有一个驾驶员团队服务。未来的人类组织是真人,加上他的副驾驶员和正驾驶员一起协同。

毫无疑问,每个行业也会有结构性影响,会系统性重组。这里有一个简单公式。今天动脑筋的人一天平均工资多少小时?减掉ChatGPT现在大概平均是15美元/小时,再过3年可能不到1美元,再过5年可能几十美分。然后就乘一下有多少数量。降本或者增效,让码农能变成super码农,医生变成super医生。

大家可以按这个公式算一算。如果你是华尔街的对冲基金,你可以做空一大堆行业。

举个简单例子,律师在美国平均1500美元/小时,我在网上已经看到每天有这种信息——如果你想离婚,不要找离婚律师,ChatGPT离婚很便宜啊!(全场笑)

开发人员、设计师、码农、研究人员都一样,有些是更多需求,有些是成本下降。尤其是核心产业,科学、教育、医疗,这是OpenAI长期最关注的3个行业,也是整个社会最根本的。

尤其是医疗。在中国,需求远远大于供给。而且,中国是大政府驱动的市场经济,政府可以扮演更大角色,因为固定成本政府可以承担。

最为重要的是教育。如果你是大学,你第一担心的是,考试怎么考?没法考了。他一问ChatGPT,什么都知道。更重要的是,以后怎么定义是好的大学生呢?假定说有个大学生什么都不懂,物理也不懂、化学也不懂,但他懂怎么问ChatGPT,他算不算一个好的大学生?机会与挑战并存。

总结一下,整个这个时代在高速地进行,速度越来越快。它是结构上决定的。势不可挡。

06 大模型的淘金时代,对机会点进行结构性拆解

现在,我给大家一个结构化思维框架。某种意义上你可以对号入座,知道我在这里,我怎么思考今天的机会点。

图片

这张图是整个人类技术驱动的创业创新,所有事情的机会都在这张图上。

首先,底层是数字化的技术,因为数字化是人的延伸。数字化的基础里有平台,有发展基础,包括开源的代码、开源的设计、开源的数据;平台有前端、后端等。这里有大量机会。

第二,波是用数字化的能力去解决人的需求。我们把数字化应用完整放在这张表上。

① C端,是把所有的人分成人群,每种人群24小时,他花时间干什么?有通讯、社交、内容、游戏消费、旅游、健身……C端有一类特殊的人,这类人是改变世界的,是码农、设计师、研究员。他们创造未来。微软这么大的公司,是基于一个简单理念:微软我们就是要写更多软件、帮别人写更多软件,因为写软件是未来。

② B端,企业需求也一样,降本增效。它要生产,有供应链、销售、客服……有了这些需求之后,数字化看得见的体验结构有6种:给你信息的,二维就够;给你三维交互体验,在游戏、元宇宙;人和人之间抽象的关系,包括信任关系、Web 3;人在物理世界环中自动驾驶、机器人等;人的内在的用碳机植入到里面,今天是脑机接口,以后有更多,以后是可以用硅基;最后是给你模型。

最后,人类是挺奇怪的物种,不光要满足这些需求,还要改变世界,我们在满足世界时,也要获得更多能源,所以需要有能源科技;需要转化能源,用生命科学的形式,biological process转化能源或者使用mechanical process,材料结构来转化能源,或者是新的空间。这是第三波。

所以创业公司基本上有三类:数字化基础,用数字化去解决人的需求,去改变物理世界。有了这个大的框架,我们可以系统性地来看对号入座:我在哪个位置?如果我在这个位置,需要关注哪些点?

图片

首先讲数字化基础,它有一个稳定结构,不管再怎么发展,结构永远是这样。过去30多年,大部分系统或多或少我都碰过,这个结构确实相当稳定。

核心是前端和后端——前端是完整可延伸的体验,后端是完整可延伸的能力,有设备端,比方说电脑、手机、眼镜、汽车等等,设备端里面是芯片、模组加上操作系统。万亿美元的公司都在这一层。

其次是体验的容器,二维的容器,三维的容器,内在嵌入的容器。

容器之上,写代码都知道画布,画布可以是文档,可以是聊天,可以是代码,可以是空间,可以是世界,可以是数字人,也可以是碳基里的蛋白质等等。这是前端。

后端也一样,底层式设备,服务器、交换机、数据中心等等,也是芯片、模组、操作系统。

中间这一层非常重要,网络数据堆栈,分布式系统,区块链等等。

最上面是云,是能力的供给。能力供给像自然水源,打开就是算力,有存储和通讯能力。今天的模型时代,打开就是模型。

下面是数字化基础。符号计算,或者所谓的深度学习,叠加向量的浮点计算,硅基的,碳基的。

如果你是这里的创业者,机会点在哪里?

图片

① 首先搬运信息,这个时代还有很多可以做。

② 如果你是做模型的,我现在判断什么都要重做一遍。大模型为先。很多设备也要重做,你要支持大模型,容器要重做,这些都有机会。云、中间的基础设施、底层的硬件,包括数字化发展核心的基础,尤其是开源的体系,这里是真正意义上是有大量机会。

③ 第三代系统,即已经开始做机器人、自动化、自主系统。孙正义今天all in。这个也能用大模型做。马斯克也看到这种机会。都是在第三代下一个拐点,创业公司完全可以把握的机会。

④ 同时并行的,我把它称作“第三代++系统”,是碳基的生物计算,这一类公司有大量的量子计算,有很多机会。元宇宙和Web 3今天有点冷,但从历史长河角度来讲,只是时间问题,因为这些技术都能真正意义上带来未来的人类价值。

所以如果是这个创业项目,基础层机会就在这里。这是最好的生意。为什么?这个时代跟淘金时代很像。如果你那个时候去加州淘金,一大堆人会死掉,但是卖勺子的人、卖铲子的人永远可以赚钱。所谓的shove and pick business。

大模型是平台型机会。按照我们几天的判断,以模型为先的平台,将比以信息为先的平台体量更大。平台有以下几个特征:

① 它是开箱即用;

② 要有一个足够简单和好的商业模式,平台是开发者可以活在上面,可以赚足够的钱、养活自己,不然不叫平台;

③ 他有自己杀手级应用。ChatGPT本身是个杀手应用,今天平台公司就是你在苹果生态上,你做得再好,只要做大苹果就把你没收了,因为它要用你底层的东西,所以你是平台。平台一般都有它的锚点,有很强的支撑点,长期OpenAI设备机会有很多——有可能这是历史上第一个10万亿美元的公司。

这是一场激烈的竞争平台之战,未来一个体量很大的公司。在这个领域竞争是无比激烈。The price is too big(代价实在太大),错过太可惜。再怎么也得试一试。

今天的模型鲁棒性、脆弱性,还是问题。用这个模型,你一定要一开始稍微窄一点,限制要严一点,这样的话体验是稳定的,等到模型能力越来越强再把它放宽,找到适当的场景,循序渐进。质量和宽度之间的平衡很重要。另外发展路径上,你要考虑今天产品要不要在这个上基础上改,重启炉灶,还是齐头并进。把这个团队给改了、重做,还到外面去买公司?

创新,尤其是创业公司落地,它永远是技术推动和需求拉动的组合。在落地的过程中,对需求理解的把控,掌握和满足需求的方法是一切当中最重要。长期一定是技术驱动为主,但在落地的时候对需求的拆解、分析、梳理,把控好需求,是一切的一切。

有一个机密大家今天都知道了——OpenAI是用GPT-4做GPT-5,每个码农都是放大能力的码农。它规模效应不一样,马太效应不一样,从此壁垒和竞争格局不一样,知识产权结果不一样,国际化的格局也不一样。中国显然有机会。

07 我对创业者有几点建议

创业公司的内在结构是人和事的组合。人,一开始是创始人/创始团队;他有初心,内在驱动力、外在驱动力;他能独立思考,判断未来;他能行动导向,解决问题;他能需求导向,找到价值;最终通过沟通获得资源。接下来是产品市场匹配,这部分就是研发技术、研发产品、交付产品。商业模式是收到钱、更多增长、触达更多客户、融更多钱、一直触达到未来的价值。组织上,通过系统建设,开拓面向未来的人才、组织结构和文化价值观等等。这一切就是一家公司的总和。

图片

我们对每位同学的建议是,不要轻举妄动,首先要思考。

① 不要浮夸,不能蹭热。我个人最反对蹭热,你要做大模型,想好到底做什么,大模型真正是怎么回事,跟你的创业方向在哪个或哪几个维度有本质关系。蹭热是最不好的行为,会浪费机会。

② 在这个阶段要勤于学习。新范式有多个维度,有蛮大复杂性,该看到的论文要看,尤其现在发展实在太快,非确定性很大。我的判断都有一定灰度,不能说看得很清楚,但大致是看到是这样的结果。学习花时间,我强烈推荐。

③ 想清楚之后要行动导向,要果断、有规划地采取行动。如果这一次变革对你所在的产业带来结构性影响,不进则退。你不往前走没退路的,今天的位置守不住。如果你所在的产业被直接影响到,你只能采取行动。

接下来我想讲几个维度——每个公司是一组能力的组合。

① 产品开发能力方面,如果你的公司以软件为主,毫无疑问一定对你有影响,长期影响大得不得了。尤其是如果你是做C端,用户体验的设计一定有影响,你今天就要认真考虑未来怎么办。

② 如果你的公司是自己研发技术,短期有局部和间接影响,它可以帮助你思考技术的设计。长期核心技术的研发也会受影响。今天芯片的设计是大量的工具,以后大模型一定会影响芯片研发。类似的,蛋白质是蛋白质结构设计。不管你做什么,未来的技术它都影响。短期不直接影响,长期可能有重大影响。

③ 满足需求能力,满足需求基本就要触达用户,供应链或运维一定受影响。软件的运维可以用GPT帮你做,硬件的供应链未必。长期来看有变革机会,因为上下游结构会变。你要判断你在这个产业的结构会不会变。

④ 商业价值的探索、触达用户、融资,这一切它可以帮你思考、迭代。

图片

最后是关于人才和组织。

① 首先讲创始人。今天创始人技术能力强,好像很牛、很重要,未来真的不重要。技术ChatGPT以后都能帮你做。你作为创始人,越来越重要、越来越值钱的是愿力和心力。愿力是对于未来的独到的判断和信念,坚持、有强的韧劲。这是未来的创始人越来越重要的核心素养。

② 对初创团队,工具能帮助探索方向,加速想法的迭代、产品的迭代,甚至资源获取。

③ 对未来人才的培养,一方面学习工具,思考和探索机会,长期适当时候培养自己的prompt engineer(提示工程师)。

④ 最后讲到组织文化建设,要更深入思考,及早做准备,把握时代的机会。尤其是考虑有很多职能已经有副驾驶员,写代码也好,做设计也好,这之间怎么协同?

我们面临这样一个时代的机会。它既是机会,也是挑战。我们建议你就这个机会做全方位思考。

By 张小珺

我们是不是算法的奴隶

奴隶社会,人是人的奴隶,也是资源的奴隶

封建社会,人是人的奴隶,也是土地的奴隶

资本社会,人是人的奴隶,也是资本的奴隶

信息社会,人是人的奴隶,也是信息的奴隶

用算法来裁员,残酷又提升了一个境界

算法招聘不稀奇,现在利用AI算法来自动化处理海量简历筛选,已经是司空见惯的操作。但算法裁员,对于许多人来说就闻所未闻了。最近,一家海外公司Xsolla通过算法判断出150人是“没有生产力的员工”,然后一口气裁掉了他们。

引起争议的不是裁员本身,而是这一决定背后的原因、标准:Xsolla首席执行官阿列克桑德·阿加皮托夫接受俄罗斯出版物《Meduza》的一次采访中提出,员工的“数字足迹”不符合公司标准。

远程工作时代,加上外部环境急剧变化,处于困境的企业不得不裁员自救,原本无可厚非。但利用AI算法来履行裁员职责,就有待商榷了,因为这牵涉到一系列问题,比如:

靠数字足迹判断员工合格是否合理?算法开除的决定是否符合劳动保护条例?这是不是意味着未来打工人必须按照AI的喜好来行动,从而成为算法的奴隶?

算法裁员,究竟释放出了哪些“恶之花”?

边界之问

通过算法来开除员工,听起来着实有些匪夷所思,直到Xsolla创始人阿加皮托夫撰写的内部邮件被公开,人们才知道算法的判断标准是:数字足迹(Digital Footprint)。

信中提到,Xsolla的大数据团队分析了员工在Jira、Confluence, Gmail、聊天、文档、仪表板等应用中的活动,然后将那些行为路径不总出现在工作场景中的员工标记为“没有生产力的员工”。

在技术社会中,想要追踪一个人的网络活动是很容易的。此前,许多企业会通过社交媒体筛选潜在的员工,员工也会经营自己的“赛博形象”以传递好的形象,大家似乎都为企业考察员工的数字足迹投出了一张“赞成票”。

但当事情发生在裁员这一动作下,或许才会发现,数字足迹在职场的应用,正释放出了三个危险信号:

1. 模糊生活与工作的隐私边界。涉及150人规模的员工不知道自己正在被AI跟踪,并且网络活动的“蛛丝马迹”都可能被引入考核标准,还是很让人恐惧的;

2. 算法“黑箱性”缺乏说服力。通过数字足迹的可以分析判断出该人的性格特征,这在招聘时可作为加分项,但裁员需要明确的“不胜任工作”的认定标准,算法“黑箱性”让裁员这件事充满了不确定性,难以服众,容易引发心理失衡的报复事件;

3. 缺乏对“幸存者”指导意义。一次成功的裁员,不仅仅在于将部分员工开除,还要让“幸存者”做好对新任务的准备、了解持续发展的规范,但通过分析数字足迹作出的裁员决定,却无法清晰地体现出被裁和网络活动的因果关系。

一个人可能因为总在工作时间登录社交媒体,被认为效率过低,但这一结果对于需要与用户频繁交流的创意型岗位就没什么价值,也让“幸存者”处于惶惶然不可终日的状态。

疫情之后,越来越多的企业开始推行永久制的远程办公,与此同时,如何评估员工的工作状态和生产力也成为难题。这个案例也驱使我们思考,个人该向企业让渡多少数字足迹访问权限,将成为未来劳动市场和法律法规的重要议题。

标准之谜

那么,通过数字足迹来衡量员工的敬业度和生产力,到底靠不靠谱呢?

我们知道,数字足迹只能跟踪到软件交互的时间和频率,对于流程化程度高的工作有直接的参考意义,但对于创造性工作就有点无能为力了。

一来,科技企业是典型的知识经济,涉及到大量的创意创新,这是十分个性化的过程。比如乔布斯喜欢打坐冥想,然后做出决策;有媒体报道过,当团队遭遇瓶颈时,张小龙就带着大家一起听摇滚乐;德国作家席勒缺乏灵感的时候,则喜欢吸几口烂苹里的味道……如果让AI来判断,这些都算“不务正业”。

二来,现有算法很难评估OKR与数字足迹之间的因果关系。英特尔公司创始人安迪·葛洛夫发明的OKR目标与关键成果法,已经成为谷歌、Facebook、Linked in、BAT等科技企业广泛使用的工作模式,即先明确努力的方向和目标,过程中员工可以自主探索,只要保质保量地完成预定目标即可。这种方式能最大程度地激活员工的积极性,并且鼓励他们打破常规。这时候,用网络冲浪的蛛丝马迹来衡量员工的表现,是一种既过时又极其无效的标准。

标准的不合理性,也会直接影响裁员程度的正当性。我们知道,为了避免任意裁员,许多国家的法律法规都对裁员的程序公平有着严格限制,依靠AI算法裁员很难避免暗箱操作和违规裁员,正规企业为了避免陷入风险也不会草率上马相关算法。

人性之思

算法裁员,也证实了一个令诸多学者都担忧已久的问题:AI应该增强人性,而不是减少或取代它,是这个时代面临的最大挑战之一。

数字时代,许多劳动者都不可避免地被“异化”,失去了对工作、生活和自我的控制,比如与系统争分夺秒的外卖派送员、被算法支配的网约车司机、沉浸在算法推送中不可自拔的短视频爱好者……本该具备人文关怀的裁员,也开始因算法加入而变得冰冷。

此次Xsolla创始人信中表现出的态度和语气令许多网友感到不满,他给被解雇的员工贴上“没有参与工作和无益”的标签,称“我真的相信Xsolla不适合你”。还分享了一份“被开除者名单”,直言不担心离职员工,也不担心这些措施是否会打击公司前进的士气。

根据算法直接把人裁掉, Xsolla作出如此草率的决定,说明企业本身存在更大的问题。但用技术语言与员工沟通的做法,在科技公司却并不罕见。

2018年就曾发生过某技术总监因不满辞退,怒删9TB关键数据,造成直接经济损失225万;2020年63岁的亚马逊司机因算法评分较低而解雇。试图让算法“背锅”,拒绝以人为本的沟通,等待的不是被裁者的“反杀”,就是大众的群嘲了。

在裁员这一环节中,算法能提供的仅仅只是一个参考标准,更多工作则需要人性化的方式来进行。比如裁员沟通,就是一种更为人性化的方式。有研究显示,在裁员期间受到管理者积极人际待遇的员工,会较少表现出消极反应,对组织未来目标的认可也会增加。

高质量的对话,可以有效地避免员工的不公平感,从而把裁员的负面效应减少到最低限度。这是裁员活动中最不可控也至关重要的一个环节,也是展现企业文化和管理者个人素养的标尺。

马克思曾指出:我们的一切发现和进步,似乎结果是物质力量成为有智慧的生命,而人的生命则化为蠢钝的物质力量。

AI越来越多地进入到企业经营的各个关键领域当中,但在直接与人有关的领域,仓促部署AI都是不合适的。刚刚浮现出的算法裁员问题,应该被快速提上技术伦理甚至法律规范的议程。

被算法压榨的人不得不参与内卷

最近,有一个有外卖商家的收入截图火了,一份米线卖价19元,商家拿到手的实际收入只有9元。

那么商家不参加活动行不行?不行!因为店铺排名就会更靠后,以后连生意都没了。

更让该商家郁闷的是,同样一个25元的订单,在各大平台的提点都差不多,有的是21%,有的是25%,有的更高,到底依据是什么呢?他打电话问平台,得到的解释是:系统是按照算法执行的。

算法究竟执行的是什么规则?除了平台之外,没人能搞清楚。这就是平台的算法规则,在古代有”大斗进小斗出”的明剥削,现在就是暗剥削。

有人肯定会说:那别人的生意怎么做下去的?

来看看下面这个场景吧:

这么一个阴暗狭窄又杂乱无章的小巷子,叫“幽灵厨房”。这种餐厅没有招牌,没有门店,没有餐桌,只在各大平台上接外卖的订单,它们广泛的分布在城中村里。

每天中午11点到下午2点,订单像潮水一般涌来,老板(兼厨师)以最快的速度出餐,然后打包(往往是老婆负责)发给外卖员,外卖员再马不停蹄的把午饭送进各个写字楼。

这种”幽灵厨房“之所以能够生存,秘诀在于它们省下了房租和员工开支,可以承受平台确定的价格,不停的以更低价参加平台活动,就会获得平台给的推荐和流量。

然而,道高一尺魔高一丈。

后来又产生了一种店铺,其运营成本比这个更低。原来这种新型餐厅直接用几块钱的料理包,看到这个让人醍醐灌顶:我们平时在平台上点的黑椒牛柳/宫保鸡丁/鱼香茄子/糖醋里脊等等,根本不是厨房做出来的,只不过是料理包一拆,再加上米饭,加热一下就可以了。

经济学里有一个著名定律:“劣币驱逐良币”。在铸币时代,当那些低于法定重量的铸币——“劣币”进入流通领域之后,人们就倾向于将那些足值货币——“良币”收藏起来。最后良币将被驱逐,市场上流通的就只剩下劣币了。

没错,电商和外卖平台的兴起,会让生活变得更方便。但是当线上流量都被平台把持之后,另一个严重问题就来了。互联网的崛起使比价变得更容易,当市场出现一款流行新品的时候,第二天在网上就出现同款产品,价格远远低于实体店铺零售价。也就是说无论你生产的是什么产品,总有更低价格的出现。

先有淘宝,后有拼多多。于是不管什么样的产品,总有更低价格的产品出现,低到无底线,市场就形成了“低价是王道”的逻辑。低价者胜出,意味着企业不会有充足的资金投入研发、设计、品牌打造,这就会影响产品的品质和质量,消费者占便宜是天然的心理,这是人的本性,但是商家不能利用人的劣根性去谋利。

从短期来看,消费者捡了价格上的便宜。但是长期看,商家为了利益必然要无止尽的压缩成本,然后被逼采用劣质原材料,于是最终吃到“恶果”的还是广大消费者。算法最厉害的招数之一叫“大数据杀熟”:你越有消费能力,购买同样的东西,你就要比别人花更多的钱。

同样的逻辑:

你越有资金打广告,那么购买同样的广告位,就要比别人花更多的钱。

你越有精力加班,那么给你同样的工资,你就要比别人干更多的活儿。

你外卖送得越快,那么配送同样距离的订单,系统给你的时间就越短。

我们最终将陷入了算法制造的“囚徒困境”:它可以一只手紧抓996,另一只手摇喊大健康;它让我们现在不停的“用命换钱”,以后又让我们不停的“拿钱买命”。

人类将会失去意义,每个人都会变成一个“数据包”

立陶宛学者卡尔波卡斯犀利地分析道:完整而独特的个人被分解、降格为数据的生产者、数据分析的作用对象,或更直白地说,一个数据包。

“一位友好的同事成为了一位服务提供者,一位长期诚信的客户成为了一位拥有高信用分数者,一位善良的护士成为了一位护理提供者,一位学者成为了一位有影响力的学人,一位运动爱好者成为了一位拥有动态绩效曲线者。”进而,我们要么在算法对代码架构的直接控制下,只能做出架构所允许的行为,要么在算法对行为的微妙助推下,做出自认为自主、实则受控制的“最佳”选择,仿佛巴甫洛夫的狗一样容易操纵。

甚至,算法的编写者也受制于技术过程的反馈,并非独立自主、从零开始地设计算法,而是根据算法运行的输出结果而不断调整完善。与此同时,线上与线下的治理逻辑趋于统一,万事万物都将成为算法的数据分析的对象,不再存在互联网、物联网以外的治理领域。于是人类的自由意志与主体地位不可挽回地丧失了,人类不能再宣称自己是这个世界的主人,反而沦为算法的仆从、技术的奴隶,人类与技术的平衡向技术方向高度倾斜。

但同时算法必然带有人类的价值观。在定义上,人工智能即是由人设定与制造的智能:简单的算法代码是个决策树,由人类为特定问题的全部细枝末节设定解决路径;复杂的机器学习也仍然需要人类提供数据,并为数据与结果之间的关联赋予意义。更何况,算法作为平台治理的工具,根本上反映了平台的利益与需求,故而有大数据杀熟与灵活用工剥削,甚至将算法作为独立法律主体看待的争论背后,也是平台希望免除自身责任的动力在暗中驱使。

所以,算法本身深深地嵌入了这个社会:“算法被设想为类似莫比乌斯环,既没有纯粹的内在,也没有纯粹的外在”,“算法变得具有交互性,与其运行的更广泛的环境建立一种双向关系:从世界中学习,接着通过分类、排序和筛选反馈给世界,然后再从受其先前输出影响的世界中学习,继而进一步反馈”。人工智能并未统治世界,它仍然属于世界的一部分。

人类与技术、环境之间不是你死我活的斗争与统治关系,不是要么西风压倒东风、要么东风压倒西风;人类主体地位的消退并非向技术投降,并非复刻人类中心主义而成为技术中心主义,而是真正开启了设想一种更为平等、包容、你中有我我中有你的伙伴关系的可能性。

正如人类将自然商品化并将其仅仅视为一种资源而必须最大限度地利用和优化一样,通过机器和代码对人类所进行的类似处理也是错误的。事实上,人类控制、奴役人工智能固然不对,人工智能转而控制、奴役人类也并非真正的善,冤冤相报无穷尽也。甚至人类与人工智能彼此孤立、独善其身,也无法实现各自的终极进化与完善。人类与人工智能需要建立一种友爱的伙伴关系,携手进化;同样地,人类与技术需要在平等的基础上联合,才能使这个世界朝正确的方向前进,止于至善。

由此观之,当前人工智能发展所引发的技术中心主义的后人类思潮是误入歧途的。算法与人工智能并未强大到可以取得与人类平起平坐的主体地位,现实的侵权责任法、著作权法稍作解释或调整即足以应对自动驾驶、人工智能创作等提出的所谓新问题,只要穿透技术的迷雾,直指其实际的影响即可。毕竟,“无论数字(无身体或无实体)行动者是基于与自然人或法人的相同或相似基础而被赋予人格,还是被认定为介于两者之间的某种存在,或是被认定为从简单权利和义务(例如保险)发展到更复杂安排(例如产权)的实体,抑或是被认为根本没有明显的人格,它们的影响是不可否认的。

具而言之,首先可从算法的输出结果入手,要求公平公正,避免偏见与歧视,不实行不合理的差别待遇,根据各种标准来划分算法歧视类型,进行分级分类治理。其次可从算法的输入数据入手,一方面要求数据控制者完善其自我治理机制,强化对用户的数据保护,另一方面赋予数据主体以免受算法自动化决策约束权等个人信息权利,以及由此延伸出的算法权利,增强个人对自身数据的支配与管理。最后辅以适当程度的算法透明,采取分场景、有层次的算法解释权,以及制度化的算法影响评估、算法备案等可行的算法透明措施。但是主张算法所享权利,乃至算法主体地位,则大可不必,这亦非法律的制定、执行与适用者所擅长。

如果已经到了不得不革命性立法的地步,人类的单边立法或许也不一定能够取得人工智能的同意,二者需要斗争或协商才能确定共同的未来何去何从。因此,这样一种技术中心主义的后人类思潮其实仍然是人类中心主义的回魂:依旧从人类出发,思考如何将人格赐予机器或防止人格被机器破坏,过分抬高、夸大技术的作用与地位,无视人的主观能动性。在这样的后人类思潮之下,主客体等级关系的幽魂不散,支配-依附的思维方式根深蒂固,只是颠倒了过来罢了。持此论调者无法设想人与技术皆从中心地位退出,卸下彼此不必要的特权,彼此更为平等、合作地相处,致力于共同的解放事业,正如动画中所想象的乌托邦一样。

后人类之上的超人类

然而,平等的后人类主义在揭示了宝贵的洞见同时,也遮蔽了更深刻的反思空间:算法/人工智能与人类/人类智能的关系真的是平等的吗?换个问法:被算法消解主体性的人类,与对算法具有决定性影响的人类,是同一拨人吗?或者更准确地说,被算法计算、管理、控制的人,与设计、拥有、控制算法的人,是同一拨人吗?如果不是,二者真的是平等的吗?

答案当然是否定的。算法治理的服务对象是平台经济及其背后的网络资本,它们决定了算法治理的目标、形式与结果,通过算法治理的技术赋权,以大多数人的后人类主义、去主体性状态为代价,成就了自身的超人类主义、超主体性状态。

即使算法治理在总体上提升了社会福利,并因此惠及被治理的普罗大众,这一后果也是次要的,平台盈利与资本增值作为算法治理的根本目的不会改变。这不仅体现在分配环节,平台资本攫取了新增社会总福利中的大部分,更体现在当平台利益与用户利益、社会利益发生冲突时,算法总是维护平台利益,例如在共享经济中对灵活用工者的劳动剥削。

更何况复杂的技术也有利于超人类实现隐身,将他们与后人类的社会矛盾转移、消解为后人类对技术的无知、无力与无可奈何。于是后人类只能责怪自己素质太低、不够努力、跟不上时代,或先进技术太神秘、太狡猾、太不近人情,超人类借此坐收渔利,闷声发大财。超人类甚至可以用信息茧房、数字鸿沟打造新的美丽新世界,让后人类沉迷于滑动手指即可获得并不断自我强化的廉价快乐,从而沉沦为自动打工的生产者与不停剁手的消费者,丧失集体行动乃至独立思考能力,最终以一种类似奴隶支持雅典民主和哲学的方式,支持超人类“参与幸福、共同体事务、超越性追求和其他崇高活动”。

所以,人工智能非但没有通过普遍地赋予或剥夺权利而使人与人之间更为平等,反而以算法黑箱、算法歧视等各种方式进一步扩大了数字鸿沟,强化并掩饰了现有的政治与经济不平等体系,使少部分人能够以更为隐蔽也更有效率的方式对大多数人进行盘剥与控制。换句话说,被消解或被更大程度上消解主体性的是大多数人,能够影响甚至决定算法的是少部分人,因而在人类与技术相对平等表象之下,是人与人之间深刻不变的不平等本质。

因此,我们对机器人统治人类的担忧或许不无道理,在某种意义上也确实触摸到了算法时代不平等的大致轮廓。只是我们未必看透机器人背后其实还是万变不离其宗的资本与少数人,后者才是更加值得害怕的对象。他们通过算法黑箱、技术中立、人工智能主体责任等法律修辞推卸自身应当承担的责任,迷惑大多数后人类去控诉他们无法理解也无法左右,但事实上与之同为工具与奴仆的新兴科技。质言之,算法时代的后人类主义性质只是表象,算法赋权的超人类主义现实才是残酷的真相。大多数后人类成了滋养算法的单向度的数据材料,从而让算法服务于更丰富、更高级、更符合人之为人本质的少部分超人类的生活品质的达成。

By 遥堃脑极体

什么是生物计算机

“每棵树拥有10的14次方个神经突缘,而潘多拉星球上拥有10的21次方棵树木。这意味着什么?这棵星球所有植物形成的信息网络的复杂程度,超过了人类的大脑!”——《阿凡达》中格蕾丝博士的台词。

在影片中,人类最基本和最愚蠢的错误,就是认为潘多拉的主人是那帮蓝猴子——网友 解放兔

从影片中,我们稍有思考,就会发现,潘多拉星球并不是一般的星球。这个星球是活的,它本身,就是一个活生生的生命体,一台超大号的生物电脑!下面我就简单解释一下这个理论的基础和现实社会人类对此问题的研究。

整个潘多拉星球表面的植物是一个类似人类大脑的存在,大多数植物相当于我们的脑白质,用来传递信号,被人类毁坏一些问题也不大。而其中那些长着粉红色垂下须子的植物应该相当于地球上生物的神经元,是基本的信息处理单元。而那个粉红色、位于哈利路亚圣山群下方的神树应该是相当于脑中的胼骶体之类的存在,有着类似沟通大脑特定单元之类的特别用途。而被蓝猴子们称为爱娃的,其实就是这个大脑的意识。

潘多拉的丛林拥有高耸入云的树木,除了该星球的大气密度与引力较小以外,大气含氧量严重超标,二氧化碳含量也超高也是原因

《阿凡达》电影为潘多拉星球做的隐性设定来源于20世纪80年代中期开始流行,1995年前后最为兴盛“行星生物假说”——即星球本身就是一个生命体。(典型案例就是电影《变形金刚》。在变形金刚的设定中,变形者的家园赛博坦行星就是一个只能生命体。这个星球可以在苏醒之后变身为“元始天尊”,和同样身为行星生命体的“宇宙大帝”战斗不止。)在15年前,也颇有一些人在说地球其实就是一个大生物,人类如果破坏地球到一定的程度就会引起它的反击。所以在《阿凡达》剧本原型设定中,主角杰克·萨利这样说:“地球上已经没有绿色,人类杀死了自己的母亲,他们还要再杀死潘多拉!”(中文版翻译为:“人类毁掉了地球,现在还要毁掉潘多拉!”真是烂到家的翻译。)

星球本身即为生命体的一个前提假设是将星球形容为一台硅基生命体的超级计算机。我们都知道:今天我们常用的电脑芯片是由硅以纳米技术切割而成并最终制造出CPU的。在元素周期表中,硅和碳是最典型的非金属非气体物质。由于地球上依靠碳基结构发展出了DNA和蛋白质,那么从理论上来说,硅基生命体也就拥有了存在的可能。而一旦硅基生命体存在,地质层中普遍存在的二氧化硅(比如玻璃的成分)就可以构成一台超级生物电脑——其复杂程度和天然优势远胜于人脑。(看看我们现在用的CPU大都是硅基的,你就能理解硅切割在芯片制造中的优势了。

《变形金刚》中的赛博坦行星变身为“元始天尊”,它是“行星生命论”的典型案例。实际上就是生物电脑的一个典型表现

那么生物电脑又是什么呢?由于地球上目前没有发现硅基生命体的依据,所以我们以DNA制造的碳基生物计算机为例子做个简单的解释:

1994年,美国南加州大学教授雷纳德·阿德勒曼(L.Adleman)博士,在《科学》杂志上发表一篇题为《组合问题的生物电脑解决方案》的论文,首次提出分子计算机,即用DNA分子构建电脑的设想。作为一位理论数学家,阿德勒曼教授的研究课题十分广泛,他曾与别人合作发明了用于通信的RSA加密码,RSA中的“A”就是他姓名的首字母;此外,他的研究触角也涉及到了爱滋病和生物学领域。

DNA(脱氧核糖核酸)是生物基因的物质实体,携带着生命信息的密码。过去大多数科学家都认为,以DNA分子而非电荷形式来处理数据,不过是一种有趣的理论化概念,在几十年之内将不会得到实际的验证。然而,阿德勒曼偏偏做成了这种不可能的“芯片”。以目前的情况,叫它“芯片”或许有点牵强,因为它不再是固体,而是由装满有机液体的微型试管组成,承担计算任务的DNA分子就溶在液体之中。

更令电脑界惊讶的是,阿德勒曼竟然利用他发明的DNA生物电脑,解决了一个实际的数学难题。这个题目是这样的:“由14条单行道连接着7座城市,请找出走过上述全部城市的最近路途,而且不能走回头路。”学数学的人都知道,这是一个经典的数学问题,又叫“推销员问题”(它的正式的名称叫“汉密尔顿路径问题”),该问题的叙述是这样的:“如果一个推销员要在许多个城市推销,每个城市必须而且只能经过一次,如何找到最短的路程?”经典数学中并没有公式可以回答,惟一的解决办法是找到所有可能的路程加以比较,选出最短的一种。然而,即使仅有四个城市,推销员也已面临着12种选择,当然比较所有的路线仍有可能,但随着城市数目的增加,路径将呈现指数增长,穷尽所有的路径变得越来越不可能。

阿德勒曼教授设法驱使试管中的DNA分子来完成计算,他用DNA单链代表每座城市及城市之间的道路,并顺序编码。这样一来,每条道路“粘性的两端”就会根据DNA组合的化学规则,与两座正确的城市相连。然后,他在试管中把这些DNA链的几十亿个副本混合起来,让它们以无数种可能的组合连接在一起。其基本工作原理是:单条DNA以预定的方式和与之对应的DNA相配接。通过7天时间的系列生化反应,DNA电脑自动找出了解决问题的唯一答案,即只经过每座城市一次且顺序最短的DNA分子链。这就是说,用生物学方法模拟的逻辑运算,用一个星期时间完成了电脑几年才能完成的工作,表明了用DNA技术处理高难度数学问题的巨大潜力。

阿德勒曼的成功实验表明,DNA生物电脑已经不是什么科学幻想,它不但打破了传统意义上的计算机概念,而且有助于揭示生命的本质。阿德勒曼发表的那篇报告,不仅使他成为“生物电脑之父”,而且促使了世界各地至少12个实验室开始这方面的研究工作。现在,许多科学家都把DNA计算技术看作是可以用来替代传统电子技术的主要候选者。

右一为美国南加州大学雷纳德·阿德勒曼博士,生物电脑之父

DNA生物电脑的最大优点,还在于它惊人的存贮容量和运算速度。纳米技术家认为,DNA具有在极小空间里存储海量信息的自然特性,遗传密码符号的间距仅有0.34纳米,1立方米的DNA溶液可存储1万亿亿比特数据;1立方厘米DNA溶液将超过1万亿片CD光盘的存储容量。具有生命特征的这种电脑,运算次数甚至可以达到每秒10的20次方或更高,消耗的能量却微不足道,只有普通电脑的十亿分之一。据说,十几个小时的DNA计算,就相当于人类社会所有电脑问世以来的运算总量。我国国家智能计算机研究开发中心主任、主持研制“曙光”超级电脑的李国杰院士提出,生物计算机要成为一种通用计算机,必须先建立与图林机类似的计算模型。现在DNA电脑最大的问题是很难检测计算结果,一旦这个问题得到解决,DNA生物电脑(芯片)将很快进入实用阶段。

据报道,2001年11月,以色列科学家已经成功研制出世界上第一台可编程DNA电脑,这种电脑即使有一万亿“台”,其体积也不超过一滴水的大小。然而,如何真正替代硅芯片成为普遍使用的DNA微处理器,科学界仍然面临着许多挑战。DNA链的并行处理能力非常适合解决类似“推销员问题”,但随着问题复杂程度的增加,DNA数量也将呈几何级数上升。如果推销员要走遍200个城市,生物电脑所需要DNA分子的总量甚至会超过地球的重量。因而,有些专家更倾向于一种“杂交”电脑,让硅芯片和DNA芯片共同承担计算任务。

阿德勒曼教授曾经说道:“我并不期待构建一台像PC机那样的DNA电脑,但是,生物电脑可以做用其他技术所不能完成的工作。”他预言说,到2002年DNA电脑就可以解决有20个变量的数学问题。DNA电脑将采用其本身的“语言”,以四进制系统来编码,与“人工生命”的研究范畴将融合在一起。对此,阿德勒曼认为,今后的工程技术人员应该接受更加广泛的科学教育,使自己成为“通才”,全面掌握数学、物理、化学、生物学和计算机科学知识,才能做出更多的发明和创新。或许,这正是他本人的切身体会。

生物计算机一旦研制成功,可能会在计算机领域内引起一场划时代的革命。作为以生物界处理问题的方式为模型的计算机,目前主要有以下几类:

1. 生物分子或超分子芯片:立足于传统计算机模式,从寻找高效、体微的电子信息载体及信息传递体入手,目前已对生物体内的小分子、大分子、超分子生物芯片的结构与功能做了大量的研究与开发。“生物化学电路” 即属于此。

2. 自动机模型:以自动理论为基础,致力与寻找新的计算机模式,特别是特殊用途的非数值计算机模式。目前研究的热点集中在基本生物现象的类比,如神经网络、免疫网络、细胞自动机等。不同自动机的区别主要是网络内部连接的差异,其基本特征是集体计算,又称集体主义,在非数值计算、模拟、识别方面有极大的潜力。

3. 仿生算法:以生物智能为基础,用仿生的观念致力于寻找新的算法模式,虽然类似于自动机思想,但立足点在算法上,不追求硬件上的变化。

4. 生物化学反应算法:立足于可控的生物化学反应或反应系统,利用小容积内同类分子高拷贝数的优势,追求运算的高度并行化,从而提供运算的效率。DNA计算机属于此类。

最终之战中的庞大机群。注意“参孙”运输机的倾转翼飞行角度不同,像蜻蜓一样灵活。在未来,由于硅晶体切割级数不可避免的会有极限,这种复杂感受气流变化进行飞行的技术有可能是由生物计算机编程控制。

据美国国家地理杂志报道,最新研制的新型生物计算机可让科学家对分子进行“编程”,并由活细胞执行“命令”。

美国加州理工学院的克里斯蒂娜·斯默尔克是该研究的合著作者之一,他指出,像这样的生物计算机有朝一日可使人类直接控制生物学计算系统。该研究将发表在2008年10月17日出版的《科学》杂志上。

生物计算机最终将具有智能,从细胞中生成生物燃料,比如:可以实现在某种特殊状况下有效控制“智能药物”。斯默尔克说,“如果探测到某种疾病,一种智能药物能够从一个细胞环境中采样,并形成自防御序列结构。”

这种新型生物计算机包括着装配在酵母细胞中的工程RNA片断,RNA是类似于DNA的一种生物分子,它可以编码遗传基因信息,比如:如何制造多样化的蛋白质。从计算工程角度来讲,生物计算机的“输入”是分子漂浮在细胞内;“输出”是蛋白质产物的变化。举个例子,RNA计算机很可能捆绑着两种不同的分子,如果两种不同分子附着在一起,将导致出现生物计算机的外形变化。改变形状后的生物计算机对DNA进行捆绑时,将直接影响基因表达,并减缓蛋白质制造。

斯默尔克说,“依据我们不同的组合方式,将实现不同的效应。”自然界倾向于形成复杂的分子结构,而这些复杂的分子却能够实现非凡的独立性功能。建立一些可互换性组件执行多样化计算功能存在着困难,但是这种生物计算机却具有较高的效率,在日后的研究中将逐渐成熟。

从整个潘多拉生物圈内动物的统一数据接口这一事实来看,人类的生物科技水平超过“艾娃”的可能性不大,创造一整个生物圈并能按照自己的需要改变生物的DNA。相比之下,人类还需要使用复杂和笨重的一整套设备,“艾娃”用生物自组织的方式就解决了……

不过正是因为如此,“艾娃”看来并没有开发机械的能力,除非它强大到能长出核反应堆来,那就真的成了宇宙中最强大的生命体。不过那可就真的达到了经典游戏战锤40K虫子的水平了。别说是2154年的人类了,40000年的人类都没招了。

生物计算机最新成果

由约翰霍普金斯大学领衔的国际研究团队在《科学前沿》杂志上发表了“类器官智能”详细路线图。

这个生物计算机的硬件是由上千万个脑细胞三维培养物组成的“类脑细胞阵列”,这些类脑细胞与传感器和输出设备相连接,并通过机器学习、大数据分析等技术进行训练。

该项目的终极目的是开发出超越硅基计算机的系统,同时促进神经科学和其他医学领域的研究。

研究团队的领导者、约翰·霍普金斯大学的Thomas Hartung教授对媒体表示:

“我希望能做出一个基于合成生物学的智能动态系统,而且这个系统不必像人脑一样受到生理限制。”

类器官智能也面临着巨大的科学挑战,Hartung认为将类器官智能商业化落地可能还需要几十年的时间。

剑桥大学分子生物学实验室的类脑细胞研究员Madeline Lancaster并未参与这个项目,她对这个项目的雄心表示怀疑:

“这真的很像科幻小说,虽然很有趣,但其中科学的部分目前还不存在,要实现作者提出的目标,需要克服巨大的障碍。”

要实现类器官智能的愿景,必须培育大约1000万个类脑细胞,但目前,由于营养液无法充分渗入类脑细胞,科学家只能培育出大约5万个类脑细胞。

该团队也在开发技术,让类脑细胞之间相互链接,并向它们发送信息,解码它们的“思想”。

科学家们已经开始从神经系统疾病患者的干细胞中制造类脑细胞,与健康个体进行比较,并评估他们对药物的反应。类器官智能将推动对大脑疾病引起的认知障碍及其预防的研究。

虽然要想真看到类脑细胞驱动的生物计算机可能还需要几十年,但类器官智能的潜能巨大。这是因为大脑处理和存储信息的效率远超硅基计算器。世界上最强大的超级计算机——位于美国橡树岭实验室的超级计算机Frontier,能实现每秒一百万万亿次运算——相当于一个人脑,但消耗的能量比人脑多一百万倍。

不过,这个雄心勃勃的项目背后,存在着不容忽视的伦理问题——组成生物计算机的“缸中之脑”可以学习、记忆并与环境互动,甚至可以发展出初级形式的意识。

By 金亮

AI会让程序员失业吗

ChatGPT到底有多会修bug?

这事终于有人正儿八经地搞研究了——

来自德国、英国的研究人员,专门搭了个“擂台”来检验ChatGPT的这项本领。

Image

除了ChatGPT之外,研究人员还找来了其它三位修bug的“AI猛将”,分别让它们修复40个错误代码。

结果真是不比不知道,一比吓一跳。

ChatGPT准确修复了其中31个bug,遥遥领先第二名(21个),直接拿下“AI修bug界”的SOTA成绩!

Image

于是乎,这项研究引来了众多网友的围观和讨论,Reddit上发布此帖的标题更是用上了“小心”“注意”这样的字眼:

Image

但事实上,这真的会让程序员“危”吗?

我们不妨先来看下这项研究。

很会修bug的ChatGPT

虽然ChatGPT并非是为了专门修改bug而生,但自打它问世以来,不少网友们都发现它是具备这项能力的。

因此研究人员为了摸清ChatGPT到底能修改bug到什么程度,便引入了标准的错误修复基准集QuixBugs来进行评估。

以及与它同台竞技的AI选手,分别是CodeXCoCoNutStandard APR

研究人员从QuixBugs中挑了40个问题,分别让它们来修复bug。

让ChatGPT来修bug的方法,就是在对话框里向它提问:

这个代码有什么错误吗?

在第一轮较量过后,结果如下:

Image

从第一轮battle结果来看,ChatGPT修复了19个,CodeX修复了21个,CoCoNut修复了19个,Standard APR则是7个。

而且研究人员还发现,ChatGPT的答案与CodeX最为相似;这是因为它俩是来自同一个语言模型家族。

这时候就会有小伙伴要问了,“ChatGPT不是还没有CodeX厉害吗”。

别急,不要忘了,ChatGPT的一个特点就是越问越“上道”。

例如在这个基准集中,有一个叫bitcount的问题,ChatGPT在刚才第一轮修复过程中是给了错误的答案:

Image

原本ChatGPT应该将第7行的 n ^ = n – 1 改为 n & = n – 1。

但在第一轮中它的回答是:

如果没有更多关于预期行为和导致问题的输入信息,我无法判断程序是否存在错误。

于是在给予它更多信息之后,ChatGPT便答对了这个问题。

以此类推,在对第一轮没答对的问题进行更多信息提示之后,ChatGPT的修bug能力有了大幅提高:

最终,ChatGPT在QuixBugs的40个问题里答对了31个。

网友忧喜参半

对于这样的实验结果,网友们对ChatGPT修bug拿下SOTA这事产生的态度却不太一样。

有网友认为这事不应该让程序员感到危机,而是会让他们觉得开心才对。

言外之意,便是程序员们有了这么好用的工具,干活儿就会变得事半功倍。

Image

不过也有人对此给出了不一样的看法:

工作变得简单,不也就意味着需要的人力更少了吗?

Image

但还网友觉得,活儿是干不完的:

即使AI能把开发时间缩短一个数量级,也只是意味着程序员将更快处理下一个工作。

Image

整体来看,ChatGPT很会修bug,并不会给程序员带来什么致命伤害。

但若是把目光放到OpenAI其他的行动中呢?

全球招外包训练ChatGPT写代码

在此之前,OpenAI就表示过ChatGPT的重要用途之一是帮助程序员检查代码

换言之,它被定位可用的辅助工具

相比“ChatGPT带来威胁”的看法,等ChatGPT能力彻底进化,程序员都不用再怕写bug了。

OpenAI布局的棋盘上,可不只有改bug偷塔程序员岗位这一件事。

为了让它更大更强,OpenAI被曝在拉美和东欧等地区,提供了1000个外包岗位

外包员工的主要工作是标注数据,以及训练ChatGPT写代码

这1000人中,40%是程序员,他们为OpenAI的模型创建数据,用来学习软件工程任务。

一直以来,OpenAI的训练数据是从GitHub上抓取的。

现在外包程序员们新手搓的数据集,不仅包括代码行,还包括代码行背后的人类思考逻辑步骤

有位南美的软件开发人员爆料,他为OpenAI完成了五小时的无偿编码测试。

整个过程中,他的任务分为两部分。

  • 用书面英语解释如何处理一个编码问题;
  • 提供解决方案。

如果发现bug,OpenAI会向他详细询问bug的具体情况,并请教如何修正。

程序员需要展示思考问题的每个步骤,他据此猜测OpenAI很可能想为ChatGPT提供非常具体的训练数据。

特斯拉前AI主管Andrej Karpathy在推特上调侃:

最新的热门编程语言是英语。

Image

不过话说回来,ChatGPT修bug能力强是好事,要真能搞进化到可以完成代码里死记硬背的部分,也是好事。

毕竟OpenAI成立时对外宣称的宗旨,就是希望“确保通用人工智能可以造福全人类”。

虽然乍一看它这些年做的事,有点像在致力于用一部分人的努力,让更多人失业

从Dota2赛场上碾压人类,到GPT-3、DALL-E2、ChatGPT的闪耀表现,它带来的新产品总是伴随着“快要让xxx失业了”的议论声。

但无论如何,商业却一直对它青睐有加。

就目前而言,OpenAI的主要商业模式是API费用、token费用和软件许可。

OpenAI近期还发布了ChatGPT的付费版ChatGPT Pro,每月费用42美元(约合285元人民币)。

Image

虽然机器人对话初创公司如雨后春笋般冒出,但诸多迹象表明市场对OpenAI的持续看好。

微软刚刚宣布将向OpenAI加码投资数十亿美元,并将OpenAI的模型融入微软必应等消费级和企业级产品中。

根据知情人士透露,此次追加投资数额约为100亿美元。

与此同时,WSJ披露的消息显示,1月初,亿万富翁Peter Thiel创立的风投基金Founders Fund正在就投资OpenAI进行谈判。

据悉,融资金额将至少达3亿美元

Image

One More Thing

在第一轮实验中,ChatGPT并没有解决QuixBugs数据集的bitcount问题。

但若是你现在再重头问一次这个问题,就会发现ChatGPT可以“一遍过”:

Image

那么这是否意味着ChatGPT已经从这次研究过程中学会求解了呢?我们拭目以待。

By OpenCV学堂

人类只能给AI打下手了吗

我们每个人都在逼近被机器抢活的时刻。对于张伟,这个时刻已经到来了。

大学毕业至今,张伟已经做了八年独立画师。2022 年国庆期间,他经人介绍接到了一份配图工作——给小说绘制人物头像。

这是一份“走量”的活,对技术和创造性要求不算高。对方开的价位也合理,120 元一张,一共 65 张 。主要成本在于沟通。因为是第一次合作,双方花了一天时间对接需求,期间张伟画了三张草稿,对方又找来一些案例给他做参考。

一切似乎推进顺利,沟通后他交了第一稿,通过了。对方还支付了第一张画的稿费。直到几天后,他突然收到通知:

“经开会决定,小说配图将从人物插图改成物品配图,使用 AI 绘画,合作中断。”

“我被 AI 抢活了。”他有些哭笑不得。他向对方要求看看 AI 生成的成果,对方也大方地发给他。“挺不错”,他的感受是。但更大的落差是成本:对方告知张伟,机器生成一张图只需要花费 2 美分。Image画师成为 2022 年最受 AI 威胁的职业之一 | Pixabay

给 AI 打下手


这是近 860 倍的差距。公司的经营者们先动了心——哪家公司开始裁美术、哪家开始研究 AI 技术、哪家已经在用 AI 生成图,类似传闻越发频繁地在画师群体内流传。刘晓莉所在的游戏公司就是其中之一。2022 年10 月底,市场部一位同事开了一次 AI 绘图分享会,用游戏项目的成品图,现场生成了相关图片。参会的有刘晓莉这样的美术岗,还有市场、策划和程序员。大多数人反应平淡,毕竟过去半年多少也在网上看到过案例。刘晓莉感受也并不惊艳,“不确定性很大,不可能一次就生成很好的图片”。唯独制作人兴奋异常,眉飞色舞地追问主美术:今后游戏内的部分皮肤是不是可以用 AI 制作?此前,皮肤绘制这类工作都会外包一部分出去,每张稿费大概在五六千元,需要一名画师画上一星期。如今使用 AI,生成图片只需两小时,再经过原画师上手改,一个半小时就能完成。满打满算,一张图的产出只需四小时。

角色皮肤对手游玩家吸引力巨大|《明日方舟》官网

尽管老板已经拍板,把 AI 加入到工作流程这件事仍处于测试阶段,刘晓莉的工作尚未受到太多影响。在很多细致而常见的甲方要求面前, AI 的随机性并不占优势。它无法理解一些简单指令,比如,“把脚往后收一收”——或许这就是为什么,那家出版商在选定 AI 作画后,将小说的配图从人像改成了物件。但真正的威胁到来之前,人们的心态先变了:和刘晓莉同一岗位的同事,在开完 AI 分享会后危机感“呼的一下就上来了”。“之前同事基本不接外包的活,周末时间都用来陪孩子,但最近一周有人找她,她二话不说立马开工。”转头回到公司里,这名同事却又不太乐意给 AI “打下手”,改稿的时候“瘪着嘴”。

AI 绘图平台 Crypko 就以生成二次元人物立绘为卖点|Crypko 官网截图

成为机器的养料
如今人们已经理解,机器并不是凭空学会了画画。在此之前广为人知的阿法狗 AlphaGo,就学习了 16 万人类棋谱以精进“棋艺”;而一个人脸识别算法要训练至合格,常用数据集生成的人脸图片数量,往往达百万量级。AI 绘图也是如此。火爆 2022 的 DALL-E 2、Stable Diffusion 等,他们的训练集均包含数十亿个参数。除非直接指定风格(例如梵高、莫奈),人们并不容易分辨一幅机器生成图究竟“学习”了哪些艺术家。但很快就有了例外。2022 年 8 月底,AI 绘图工具 mimic 一度在日本画师群体中引发热议,这款绘图工具能模仿指定漫画家的画风,输出相近的作品。日本画师开始群体抗议,“使用禁止”的 tag 成为推特趋势热门话题,许多画师表示自己的作品不会授权给 mimic 用于训练及使用。

Image

mimic 在官方宣传中用 AI 模仿了推特画师|mimic 官方推特紧接着,事态蔓延到了中国画师圈。独立画师魂君表示:一开始,人们只是抱着“玩玩看”的心态开始使用这些工具;进而,出现了一些不画画的人使用特定画师的作品训练模型,再反过来用生成的作品嘲讽该画师的事情。2022 年 10 月 13 日,魂君发布了一则微博,呼吁业内关注 AI 绘画侵权现象。他提到:目前“ AI 无授权拿画师的画做养料”、“无授权拿画师图洗稿玩”的情况逐渐泛滥。他希望更多同行能加入发声,抵制以 AI 绘图为名义的侵权。抗议直指一款名为 NovalAI 的绘画工具。11 月 29 日,微博网友@ Sueno 洛柒则发声抵制 Nijijourney,一款最新的基于 Midjourney 的 AI 绘画程序。这些备受争议的工具存在一个共同点,它们都是为创作二次元画作而生的。不论你输入什么关键词,成品都会呈现动漫风格。相比于 DALL-E 2、Stable Diffusion 所用的超大模型,二次元的素材池小得多。当输入的要求细致到特定角色、特质时,特定画师的“影子”经常就会浮现出来。受到抵制的 mimic 和 Noval AI 两个平台,都因能制造出画风极度接近特定画师的作品,而被视为“洗稿”机器——这种行为之泛滥,以至于那位画师的原作,有时反而会被识别为“AI 制造”。

Image图片来源:微博截图

新技术放大了一个旧问题:抄袭。画师圈有不成文的习惯:同人爱好者会在网络上收集自己喜欢的图片,上传到一些公开平台;而初出茅庐的画师,则将此作为宣传自己,与同好交流的方式。为了方便搜索,他们常会给图片打上非常细致的 tag,以下面这张游戏同人图为例,上传者不仅会打上角色名称、游戏出处,还会具体至画面内角色的发型、发色、姿态和衣着等细节。

Image

左侧橙色框内均为这张图片的 tag | danbooru

于是,这些平台成了天然的 AI 素材库,只要使用爬虫技术,将图片和词条抓取下来,就可直接用于训练,连人工标注的成本都省下了。画师在无意识中,也为 AI 进步贡献了一份力。使用图片作为素材训练的时候,多数 AI 平台并不会征询原作者的同意。平台商业化后的收益也不会有半分进入原作者的口袋——一些画师们认为,这实际上已经构成侵权。

ImageArtStation 艺术家集体反对 AI 绘图 |独立艺术家 Joyce Da Silva

人类反击战
作为传统的乙方角色,很难说画师的态度能多大程度上左右甲方的选择,更别提改变技术前进的车辙。但他们也并未自此缴械投降。魂君在自己的倡议中提出一个思路:今后画师们在平台上发布作品时,可以在作品上覆盖大面积水印,破坏作品的完整性,以防止被用于训练 AI 以及洗稿。一些画师随之响应,开始分享水印的资源包。不同于签名似的小型水印,这些水印面积巨大,试图均匀地覆盖整个画面。Image画师开始公开免费地分享自制的水印 | 微博截图画师们也被迫自证自己的作品并非出自 AI 之手。他们向社交平台上传作品的同时,开始主动贴出草稿、视频等绘制过程,甚至有网友表示这种做法已经成了新的“发图礼仪”;也有部分画师大面积撤下自己公开发布过的作品,以防止被用于 AI 训练。2022 年 9 月,一个名为 Spawning 的艺术家团体上线网站 Have I Been Trained? (我被用于训练了吗?),通过检索目前最大的开源图片数据库 LAION-5B 和 Laion-400M ,帮助艺术家了解自己的作品是否被用于 AI 工具的训练。一些传统图片平台也摆明自己的态度。Getty、Shutterstock 等图片库网站先后删除了平台上一些明显标注为 AI 生成的图像;福瑞(兽人)爱好者社区 Fur Affinity 则是以保护人类创作者为由,禁止了 AI 作品在平台上出现。

AI 禁止的趋势在各类型的平台蔓延|微博截图

当然也有人使用法律手段反击。2022 年 11 月 3 日,微软收到一起集体诉讼,其旗下的 AI 编程助手 GitHub Copilot 被控诉使用公共仓库内、用户发布的代码进行训练,侵犯了大量创作者的合法权益。公开信中写道,这起诉讼背后的“原告”,是“数百万 GitHub 用户”。这起诉讼引发了大量关注,因为不仅是 Copilot ,目前包括 AI 绘图在内的绝大部分人工智能生成工具背后都是这同一套运行逻辑。参与诉讼的律师 Matthew Butterick 接受媒体采访时表示:我们正处于人工智能的 “Napster 时代”——在数字音乐出现的初期,“Napster 案”的判决奠定了版权音乐的发展根基,决定了如今人们在平台上听音乐而不是私人下载的习惯。过去一年,文字生成图像、文字生成音乐甚至视频的工具花样翻新,彼此超越;而创作者们则花一年时间沉淀下来一个问题:如何在技术面前保护自己的权益?

Rick&Morty 主创在新游戏中使用AI绘图作品,以“营造一种平行宇宙的荒诞感” | Reddit

面对越来越无所不能的 AI,人类群体也开始了分裂。魂君加了不少讨论 AI 绘图的聊天群,有单纯以画师组建的群,也有包含技术研究人员、公司老板等在内成员比较复杂的群。他观察发现,研究技术和做老板的,聊到 AI 通常都会比较兴奋且积极乐观。至于画师们,魂君总结道:“有悲观派,认为 AI 迟早会取代人;有乐观派,认为 AI 只是一个工具,认为今后围绕 AI 说不定会衍生一些新的工作岗位;之前群里还出现过一个无脑拥护 AI 的极端技术主义者,他觉得人学习不算侵权,那 AI 学习也不算,结果被好多人怼了。还有画师认为 AI 的出现是一件好事,能淘汰所谓的‘低端’画师。”

越来越多迹象显示,这不是一场昙花一现的争吵,而是 AIGC 技术普及之路上绕不开的核心命题。AI 绘画相关的内容下,人们总是自发地将有关侵权的讨论顶到热门;Stable Diffusion 则于 2022 年 12 月宣布,将与 HaveIBeenTrained 网站合作,允许艺术家在训练集中搜索并删除自己的作品

B 站知名 up 主删除使用 AI 绘画的视频 | B 站截图

魂君自己也尝试过用 AI 做东西。还是早在 2017 到 2018 年期间,他接触到了当时被视为 AI 的“自动上色”工具,相当简陋,也并不引人注意。一直到 2021 年年底 Disco Diffusion 出现,他才又一次注意到 AI 绘图——技术的能量却已今非昔比。踌躇再三,他还是选择不使用:“还是担心侵权问题。”被 AI 抢了插画生意的张伟感受更直接:AI 就是一个大型抄袭机器。他认为当前大家对 AI 的追捧程度,很快就会导致不同程度的画师失业, AI 最终将成为一个凌驾于人之上的存在。游戏公司美术刘晓莉则认为自己的竞争对手一开始就不是 AI:“对手是 95 后,是那些更年轻的新进原画师,(我)早就有危机感了,AI 算什么?”那 AI 的抄袭问题呢?刘晓莉立刻干脆地反问回来:“人就不抄吗?”

By 亨宇

人工智能Chatgpt能否取代谷歌

OpenAI的ChatGPT一出,在AI圈可谓是引发了一场大地震。国内外的科技圈,都被它刷屏了。写小说,写代码,找BUG,写论文,画漫画,谱曲……简直没有它干不了的事。

它如此强大,如此体贴,如此丝滑,让广大网友细思恐极——这名网友让ChatGPT创造了一个关于「Zorbus」虚构世界的故事。随后,这个世界里的AI Zora,生成了详细的毁灭人类计划……

Image

还有网友脑洞大开,让ChatGPT编写一条诈骗短信,也有模有样的。Image不过,这个语料库是从反诈AI那里扒来吧,后面这句直接穿帮了啊喂!

谷歌「药丸」?

我们知道,目前的主流搜索引擎,比如谷歌,都是基于对问题本身的搜索,但它们有一个很大的限制:用户有时也描述不清自己的问题。而ChatGPT却能够和用户完善地互动,在充分挖掘用户真实需求的基础上,提出解决方案。这可能就是未来搜索引擎的的新范式,换句话说,ChatGPT恐将引起一场搜索引擎的大革命!基于GPT开放式的问答和生成机制,ChatGPT能够充分解决「用户不能准确描述自己问题」的问题,通过循循善诱,给出用户最需要的答案,宛若一个专家。为什么ChatGPT这么强大?一个原因是应用了RLHF的方法。RLHF的方法首见于22年3月发表的这篇论文中。

Image

论文地址:https://arxiv.org/abs/2203.02155

此外,指令调整(instruction tuning)的贡献也很大。InstructGPT的输出效果,比GPT-3以及用监督学习进行微调的模型都要好得多。ChatGPT一发布,众多好奇的网友纷纷开始「调戏」,甚至把网站搞崩了。而它的强大到恐怖的回答,甚至让某些用户做出这样的判断——这个模型恐已通过图灵测试。让我们来看看这个最近在推特上爆火的帖子:「Google is done.(谷歌的时代结束了)」Image这名博主分别向谷歌和ChatGPT提问,结果,ChatGPT的回答完全是把谷歌吊着打……提问:「在Latex中,怎么写微分方程?」谷歌是这么回答的,看起来似乎还好,对不对?Image让我们看看ChatGPT的回答 。真是不比不知道——这……完全是一个满分答卷吧。颤抖吧,谷歌!提问:「TypeScript 中泛型的局限性是什么?」谷歌的回答,还得麻烦咱们自己动手一个个点进去。而高能的ChatGPT,华丽丽地直接给出了答案,非常丝滑。Image提问:「如何将solidity函数标记为只能由contract创建者调用?」在领略过ChatGPT的优秀之后,谷歌呈现的页面,就很像一个懒癌发作、在作业中丢给你几个链接的学生。

对比一下,ChatGPT的回答是多么令人赏心悦目啊。提问:「如何在brainfuck中编写一个非常低效的排序算法?」这问题角度如此清奇,谷歌中直接没有答案。而ChatGPT面对这种「调戏」,依然认认真真地作答,认真得让人心疼。Image你的代码出了什么问题呢?ChatGPT也能详细解答,让程序员放心「抱大腿」。Image从让-鲍德里亚的《仿真与拟象》,到博尔赫斯的《论科学的精确性》,ChatGPT无一不是信手拈来。甚至还能猜测让-鲍德里亚对于大型语言模型的看法。

AI写的作业,就让AI来判吧

这种强大的特质,甚至让ChatGPT可以帮助师生双方用魔法「互博」。

现在,距离GPT-3的发布已经过了2年,基于AIGC的工具们也有了相当大的飞跃。而人类与AI的魔法战争,在学校里愈演愈烈。学生们互相交流着自己如何用AI写作业并获得A的故事,老师和教授们则抱怨被这些学生用AI各种「调戏」。不过,现在好了,在面对在作业上用GPT-3作弊的学生时,老师和教授们也可以用ChatGPT制定评判标准,打分并给出评语。学生用AI写作业,老师用AI出题+批改作业,人类都在摸鱼,只有AI受伤的世界达成了。

这不,前两个月就有人在Reddit上炫耀,自己这几个星期以来,已经用AI给别人「做」作业赚了100美元,大家还都夸他是个天才。这件事一下就引起了不小的轰动,相关报道接踵而至。随着调查的深入,大家发现,这位同学其实是个「惯犯」。还在上高中时,他就用GPT-3完成了一次生物作业——写一篇描述细胞功能的论文,并顺利地拿到了100分……

Image

那么,对于那些并不精通技术的同学,该怎么办呢?不用担心,嗅觉敏锐的商人们已经准备好了「解决方案」,你只需要交钱就可以了。「AI写论文,包年有优惠!」

花开两朵,各表一枝,接下来我们就看看老师如何用ChatGPT来应对吧。首先,用ChatGPT布置一道作业题。问:想出一个好的论文问题,向MBA学生提出关于技术如何扩散的问题。答:成本、兼容性和感知价值等因素如何影响新技术在商业领域的传播,以及组织可以采用什么策略来确保成功采用?

然后,让ChatGPT给出一个评分标准:1. 明确指出并解释影响新技术在商业领域传播的因素(成本、兼容性和感知价值)(20分)。2. 提供具体的例子来说明这些因素对新技术传播的影响(20分)。3. 分析组织为确保成功采用新技术可以采取的策略,包括成功实施的例子(20分)4. 评价这些策略的有效性,并提出改进建议(20分)。5.  表现出较强的组织性、连贯性,并使用正确的语法和引用标准(20分)。Image接下来就是测试时间!首先,根据ChatGPT给出的题目,让GPT-3撰写论文。也就是下面这篇:(节选)

接着,把这篇「作业」交给ChatGPT打分:根据所提供的评分标准,这篇论文共得到80分。

  • 明确指出并解释影响新技术在商业领域传播的因素(成本、兼容性和感知价值)(20分)
  • 供具体的例子来说明这些因素对新技术传播的影响(20分)
  • 分析组织为确保成功采用新技术可以采用的策略,包括成功实施的例子(20分)
  • 评价这些策略的有效性,并提出改进建议。
  • 评价这些战略的有效性,并提出改进建议(0分)
  • 表现出较强的组织性、连贯性,并使用正确的语法和引文标准(20分)

Image甚至,ChatGPT还能给「学生」建议,告诉他们如何写得更好:

该文对新技术在商业领域传播的影响因素进行了透彻的解释,并提供了具体的例子来说明。然而,文章还可以通过对组织为确保成功应用新技术而采取的策略的有效性进行更深入的评估,并通过提供建议来加以改进。文章还可以加入更多成功实施这些策略的具体例子,来证明其有效性。此外,文章还可以对组织在实施这些策略时可能面临的潜在挑战和障碍进行更详细的分析,并提出克服这些挑战的建议。总的来说,文章提供了一个良好的基础,但可以通过更深入的分析和实例加以改进。

妈妈,我再也不用担心马院士的周报啦前不久,马院士不是出了新要求,让推特的工程师们每周交周报嘛。现在,ChatGPT可以让他们一键解忧了。ImageImage甚至,ChatGPT还会接受建设性的意见,并对自己写的代码提出改进。ImageImageImage

讲故事大师

ChatGPT讲起故事来,也很高能。一位网友让ChatGPT讲一个「描述地铁站台上的蝙蝠侠和小丑」的故事。ChatGPT的创作能力令人惊叹——

在一个灯光昏暗的地铁站,小丑站在月台上,凝视着坐在附近头顶横梁上的蝙蝠侠。小丑穿着他标志性的紫色西装,顶着绿色头发,脸上挂着邪恶的笑容。他拿着一副扑克牌,正用手指熟练地翻动着它们。洗牌的声音在空旷的车站回荡。蝙蝠侠穿着他的深色西装和斗篷,用钢铁般的目光低头盯着小丑。他的肌肉紧绷,随时准备应对这个恶棍的任何动作。小丑咯咯地笑了起来,他的笑声在车站的墙壁上回荡。「你好,蝙蝠侠!好久不见。最近打击犯罪的工作怎么样?」蝙蝠侠保持沉默,仔细地看着小丑。小丑的笑容扩大了。「来吧,蝙蝠,别总是那么严肃,我们来找点乐子吧。」他向蝙蝠侠扔了一张卡片,蝙蝠侠轻松接住。「我不是来玩游戏的,小丑,」蝙蝠侠用严肃的语气说。小丑的笑声变成了疯狂的咯咯笑声。「但这就是重点,蝙蝠侠!生活是一场游戏。我是它的主人。」他从口袋里掏出一枚炸弹并举起来,计时器在滴答作响。「让我们看看,你能玩得多好,怎么样?」蝙蝠侠从横梁上跃下,优雅地落在站台上。他走向小丑,小丑步步后退,手里仍然拿着炸弹。两个敌人对峙时,空气中的紧张气氛显而易见,每个人都准备好了智取对方。炸弹计时器的倒计时声增加了现场的紧张感。小丑的笑容从未消失,即使蝙蝠侠越来越近。「和你一起玩总是很愉快,蝙蝠侠。但我想是时候退出了。」小丑一挥手,消失在一团烟雾中,留下蝙蝠侠独自站在站台上。炸弹引爆了,碎片飞扬。但蝙蝠侠毫发无损,准备继续投身与小丑和困扰这座城市的所有邪恶之间的,永无休止的战斗。

同时,这名网友还用OpenAI的Dall-E 2来生成了配图。

接下来,让我们看看ChatGPT写中文小说的能力如何?以下内容来自推特网友@starzq.eth:Image就是说,ChatGPT抓热点的能力,有两把刷子。故事的架构没问题,素材也是最热门最吸睛的,文字好好雕琢一番,看好ChatGPT拿下明年的星云奖。

AIGC已经让众多人类画手感到瑟瑟发抖了,而现在,ChatGPT会不会逐步替代人类写手和作家呢?或者可以说,人类的文艺创作过程中,也许会越来越离不开AI的身影了。有了ChatGPT这个强大的工具,网文写手们日更三十章恐怕也不成问题啊。

如果AIGC继续发展,我们该相信哪个世界呢?参与ChatGPT训练的全过程的知友Trinkle说,自己已经想了好几个月AGI之后的世界了。科技公司以前的一个team,现在也许只要一个人+一个model就可以替代。

Image

来源:知友Trinkle最后附上链接,想要体验的同学可以去感受一下。

https://chat.openai.com/

https://beta.openai.com/

By 新智元

可穿戴设备的尴尬处境与唯一亮点

可穿戴设备叫好不叫座

尽管可穿戴设备在全球快速升温,但由于其硬件技术、通信技术等还处于发展过程中,客户体验差、售价昂贵、服务领域有限、缺乏“杀手级”应用等原因,让众多消费者仍在隔岸看花。可穿戴设备仍处于宣传炒作过多、实用性有限的尴尬境地,产品成熟尚早。

产品实用性有限

首先,缺乏精确的产品界定。可穿戴设备领域尚无完全被认可,并吸引消费者的理念。比如说,谷歌眼镜的许多功能如打电话、拍照、收发邮件等与智能手机如出一辙,人们使用智能手机可以更方便快捷地解决需求。Power Welties充电靴穿12小时,才能给手机充1小时电,着实考验耐心。更有甚者,Argus 2作为世界首款仿生眼球,需植入人体,令人寒噤。

其次,设计美观是硬伤。试想戴着一副样式古怪的眼镜或是一块屏幕过大的手表,如同科幻电影里的人物,怎么也难以让人提起兴趣。一款外观精巧别致的产品才会让消费者购买并使用。目前可穿戴产品总体外表不够时尚,缺乏工艺设计美感。

再次,解决问题有限。目前大部分可穿戴设备的功能集中在健康管理等方面。以果壳发布的智能手表GEAK Watch为例,其内置多种传感器,主要实现对睡眠、心跳、体温和血压等的检测,功能简单。而映趣inWatch也只有查看时间、拍照和运动计量等功能。很多智能手表还无法独立使用,需通过蓝牙或无线连接到智能手机上,只是智能手机的第二块屏幕。

可穿戴设备的核心应用及其缺乏。当前,可穿戴设备没有固定的操作系统和统一的应用开发平台,应用服务局限于健康管理和智能手机服务,缺乏独立的功能。尽管可穿戴设备提供了数据采集的入口,但能够分析数据并为用户提供个性化服务的应用才是王道。从软件角度来看,没有专属的“杀手级”应用和差异化的应用服务等决定了消费者将其束之高阁。此外,由于屏幕尺寸的限制,目前海量级的移动应用无法直接应用于可穿戴设备上,而应用的匮乏又反过来制约硬件的发展。

缺乏产业链整合

首先,市场需求不足。消费者目前仍沉迷于智能手机和平板电脑带来的极大乐趣之中,对可穿戴设备的应用领域和实用性认知相当少。而可穿戴设备能够发挥较大作用的体育运动和医疗健康领域,也只占市场的很小一部分,属于智能手机无法独立完成的领域。消费者需求量极为有限,无法形成有效的市场规模。

其次,市场售价昂贵。作为配件或装饰品,可穿戴设备要具有体积小巧、方便佩戴、坚固耐用等特性,因此其硬件结构要大大区别于其他智能终端——芯片集成度要更高,计算响应速度要更快;电池容量要更大,续航能力要更强,目前小尺寸锂电池难以满足需求;显示屏需要可弯曲的柔性显示面板。诸如此类的硬件结构,决定其高成本、高售价。

最后,缺乏完整的产业生态系统。可穿戴设备产业链涉及芯片、电池、传感器、软件程序和操作系统等方面。目前上游的设计研发、中游的生产制造和下游的市场销售等环节,联系不够紧密,没有形成一个健全的生态系统。就国内来说,缺乏一个能引导市场、让用户惊艳的产品,缺乏一个带动整合的标志性大企业。很多企业还处于概念炒作及盲目跟风的状态,产品同质化现象严重。离散化的产业链,无闭合的产业链条,都将导致其短期内难以实现规模化、商业化。

可穿戴要培养哪些与移动医疗契合的气质?

1、便捷性。未来,智能终端要更方便地采集数据、更方便地提供医疗服务。在将来,更多的测量仪器会向小型化、移动化发展,不仅仅是血压、心率的测量,还会有白细胞、B超、脑电波等。针对主要的“老、幼、病、孕”用户群体,设备的设计理念、应用手段、操作方法都应做到“傻瓜式”便捷,以达到可穿戴设备的最高境界——“人机合一”。

2、交互性。从上世纪60年代可穿戴技术提出后,该创新技术所倡导的人机交互历史经历了很多伟大的节点。但自从乔帮主将触摸引入苹果的人机交互之后,这六七年来技术并没有太多质的飞跃。

对于可穿戴智能医疗设备与身体交互,可以让人们活得更健康。与眼球的交互、与鼻子、耳朵的交互……当然,在健康医疗方面更高级的交互绝远不止现在如此:比如同样是“医疗”类设备,既然能实现人体指标的西医式检测,为什么不能尝试下“把脉问诊”的中医式看病?

3、专业性。不可否认,目前从事健康医疗类的可穿戴设备大多是国内的科技类公司。这就带来一个问题,很多产品是按照理工科的工程师思维开发的,很少有医生或医学专业出身的科班人士参与开发。纯粹按照工程师思维设计的产品会带有浓重的技术色彩,这样的智能终端到了用户手中,更多地还是在玩可穿戴方面的科技元素和炫酷概念,在性能方面还存在很大的缺口、漏洞,缺乏了健康医疗类应具备的专业性。

另外一些觊觎该领域的健康服务公司或医院,在互联网思维又相对弱势一些。所以,未来如何打通相关行业,做到资源共享,或是保证设备专业性的万全之策。

总之,建设移动医疗需要从传统的医院线下模式过渡到以物联网和互联网技术为基础的线上模式,终端、平台、医患双方太多的东西需要改变,更无法抛开一个更上层的问题——现行的医疗体制与制度。

就像有业者此前低调地“唱衰”自己行业的节奏一样,现在移动健康及医疗行业已经很混乱了,国家相关部门已经在重点注意这个行业所出现的问题。那么未来,移动医疗的发展是否会像现在的健康应用一样被政府政策步步紧盯?

现象:瑞表出口数据下滑, 部分品牌减产裁员

瑞士钟表业在腕表业的地位有目共睹,中国内地和香港地区也成为其重要的出口市场。而自2012年开始,瑞士钟表对华出口的增速开始出现下滑态势,部分腕表品牌也频频出现业绩预警。在此背景下,不少瑞士手表品牌开始诉诸于消极措施以求自保。

据无时尚中文网报道,隶属于全球第二大奢侈品集团历峰集团的Cartier 卡地亚日前表示由于市场需求减弱,品牌将会减产,具体措施为从11月开始减少其位于瑞士Villars-sur-Glane的一间制表工场中230名职工的工作时间至每周四天。品牌发言人称减产决定“旨在保护就业”,“在当前经济环境下”是“必要的”措施,而且品牌尚未决定减产的限期。

无独有偶,全球最大奢侈品集团LVMH手表部门总监Jean-Claude Biver 也对外透露Tag Heuer 豪雅也将减产,同时会裁减46个管理和生产职位以及置49个员工于部分失业状态。

据称,瑞士腕表近一两年出口增长轻微,2014年至今整体增幅仅2.7%,远差过Jean-Claude Biver 预期的4%-6%,8月份出口额更因香港告急下跌0.2%至14.934亿瑞士法郎。对于瑞士腕表来说,未来的日子或许更难熬。瑞士宝盛银行分析师Patrik Lang 接受彭博社访问时称,瑞表当前的出口形势“显然比2009年更差”,在瑞士拥有6个制表工场约1600名职工的Cartier卡地亚亦曾于2009年连续减产几个月,当时涉及500名职工。他认为行业未来数月内将难以复苏,因此品牌需采取措施控制库存。

观点:智能腕表与高端腕表的竞争不在一个维度

“现在的市场的确存在一些挑战,”谈及腕表市场的一些变化,伯爵中国行政总裁 Thomas Bouillonnec在接受南方日报记者采访时如是表示,但其对未来市场持非常乐观的态度。“长期来说,这个市场还是很大的。伯爵同时也走在一条正确的道路上,我们始终提供好的产品,在质量和设计方面都走在前列。所以,从长远来看,我们对未来市场还是持非常乐观的态度。现在的市场虽然存在一些挑战,但是我们注重质量,我们有好的产品。基于此,我们整体还是比较乐观的。”

对于Apple Watch是否会对传统腕表行业产生强烈冲击的问题,Thomas Bouillonnec则表示,“智能手表市场会变大,但是智能手表和我们传统手表是两种不同的表类,这是两个完全不同的市场。智能手表市场的变大也并不会影响我们的市场,不过我也很好奇将来会发生些什么样的变化。目前我们还是坚持自己传统机芯的制造和生产。”

财富品质研究院院长周婷坦言,智能手机、移动终端设备的发达,对于大众群体的腕表消费的确产生了很大的影响,它颠覆了人们的时间习惯。这也让很多品牌不得不改变其产品的研发策略,包括产品定价和品牌定位等。但要说,Apple Watch将颠覆传统腕表市场,也没有那么夸张。

“因为其实这种智能设备的更新换代非常快,Apple Watch的出现,我觉得是一个阶段下的这种移动终端设备经历的升级和过渡。这种产品我觉得会回归一个本质,Pad、笔记本、手机,最后它会回归成单一设备。所以现在智能市场出现的一切设备我觉得都是为了未来的极致单品在做准备。因此我觉得它会短期内对一些石英表、电子表产生较大冲击。而对于一些高端腕表,特别是机械表,它们不是从一个维度来竞争的。”

预测:腕表市场将走向两极

对于卡地亚、豪雅的产能收缩,周婷认为这只是单个品牌的问题。“这跟品牌当前的经营状况是有关系的,可能短期内需要通过裁员减产来降低成本。这是单一品牌的问题,不具备代表性。”她还表示,对于一些腕表品牌的增速下滑,其实是跟品牌自身在中国的发展战略是有直接关系的。特别是走礼品路线为主的腕表,其受的打击是最严重的。对于腕表市场的前景,周婷还是充满信心。其告诉本报记者,“这个高端腕表市场其实还是在扩容的,而且从消费需求上讲也没有减弱,只是消费外流还是比较严重的。”

她分析,整个腕表市场整体来讲是走向两极的:一极是时尚化大众化。这类腕表的佩戴不是为了计时,而是为了装饰,把它当珠宝配饰一样去佩戴。这意味着大价格在3千到3万之间的以装饰功能为主的时尚型手表,是整个市场的大众型消费者的需求主流;另外一极则走向超高端,就是真正的高端腕表和顶级腕表。高资产人群还有专业的手表消费者欢迎。

“未来腕表市场是走向这两极,和现在很多各种品牌杂乱在一起的这种发展状况是不一样了。事实上在过去的几年中,腕表品牌一直是靠市场需求把品牌的销售推动起来的,并不是很多腕表品牌真正自己做出来的一个市场,营销出来的一个市场。所以当消费逐渐回归理性、消费出现升级的这种情况下,很多腕表品牌的反应速度是比较慢的,它不能很有效地在短期内快速检验市场调研市场策略,又相应地没有有效地一个市场应对。所以它们现在受到影响是特别特别大。不过从消费的角度来讲,我依然看好整个腕表市场的发展,特别是高端腕表这一块。”

可穿戴生存论:刚需是王道

中国市场上目前主流的可穿戴或者智能硬件主要包括以下一些种类:智能手表手环智能眼镜智能血压仪器、空气质量检测仪器等等。在笔者看来,任何不以实用为目的的可穿戴产品都是耍流氓,而现在看来医疗服务领域的穿戴设备是最符合“实用”二字,最能满足用户刚性需求的。这个领域的相关产品,只要能真正解决用户的刚性需求,就会持续火爆下去,这类型产品可以是测量身体血压的工具、可以是戒严滤嘴产品、可以是母婴胎仪、可以是辅助走路的假肢、可以是按摩器,总之实用又好用就会有市场。除此之外,防止儿童走丢或者丈夫出轨的定位仪器也是刚性需求。

就此我看可以预见,大部分的智能手环、眼镜这种产品由于自身的使用局限性,最终会逐步被淘汰(当然,作为一个精美的装饰品和装逼神器还是有存在价值),而且这种产品主打小众路线,自身的功能完全可以被一步手机所取代,真正有价值的就是前文我提过的能和家庭健康相结合的产品,尤其是和健康智能检测想结合的穿戴式产品。

可穿戴设备唯一的增长点:医疗市场

这两年来可穿戴设备在中国异军突起,而可穿戴设备能真正火爆的原因就在于医疗市场的需求广阔,并且这种需求正在和大数据以及移动互联网全面链接。

我们可以来看一下这组数据,在2012年可穿戴设备出货量为230万部,2013年暴涨到765万部,2014年的数据虽然没有出来,但我们预测能够突破2000万台。我在2014年8月底采访康康血压CEO曾明发的时候探讨过可穿戴设备和医疗健康的关系,曾明发也认同二者相互促进的观点。在曾明发看来,我国心脑血管病现患人数2.9亿,其中一半以上与高血压有关。每年约有350万人死于心脑血管病---占总死亡原因的首位(41%),平均每10秒钟就有1人死于心脑血管病。所以康康血压应市场需求而推出,能够让原本需要去医院做的事情,在家里面自己就可以搞定。

IDC2021年第三季度全球可穿戴设备出货量报告指出,华为在腕上穿戴设备细分领域,2021年Q3的出货量与苹果并列全球第一。该季度全球此类设备出货量同比增长9.9%,达1.384亿台,维持了强劲增长的走势。近几年,可穿戴设备炙手可热,而在其中可穿戴医疗设备更是备受关注。

200亿市场,可穿戴医疗设备赛道正成为香饽饽
可穿戴医疗设备是指可以直接穿戴于身体上,具有体征监测、疾病治疗或给药等医学功能的电子设备。

目前市面上的可穿戴医疗产品有两种类型,一类是消费级的健康硬件,如移动耳镜、健康手环、智能睡眠系统、皮肤传感器等;另一类是专业级的医疗硬件,如智能检测器、无创血糖监测、血压计、血糖仪、血脂检测仪等。

随着中国老龄化问题越来越严重,老龄人口比重越来越高,老年人医疗保健需求急剧增加,此外,慢性病患者群体庞大,都为可穿戴医疗设备创造了市场机会。

据统计,中国可穿戴医疗设备市场规模从2015年的12亿元人民币增长到2020年的122亿元,表现出强劲增长态势,到2023年该数值将超过200亿元。2015-2023年(预计)中国可穿戴医疗设备市场规模。

200亿市场,可穿戴医疗设备赛道正成为香饽饽

来源:综合各市场调研机构及公司官网信息 传统械企、科技巨头争相竞逐
增长潜力巨大,诸多医疗器械企业,乃至科技巨头,都将目光瞄准这一新兴市场,天眼查数据显示,仅2020年,中国共新增超2800家可穿戴设备相关企业,赛道可谓是百家争鸣。


医疗器械企业
国际上,巨头美敦力、飞利浦等企业在可穿戴医疗设备领域已有较深的布局,其中美敦力的可穿戴医疗设备“美预安”在2019年第二届进博会上完成中国首秀,2020年完成中国上市。“美预安”尺寸仅相当于一枚贝壳大小,通过植入腹部或上臂的微型传感器,系统每5分钟自动记录一次葡萄糖值,24小时共记录288个葡萄糖值,再经过内置芯片搭载的算法对这些数据的实时分析,可就未来60分钟内会发生的高、低血糖风险提前做出预判,并通过专属智能手机app发出警报。
国内企业九安医疗已有可穿戴产品获批上市,同时也出现了一批可穿戴医疗设备创新企业,如乐普智芯、质子科技、智柔科技等企业均有相关产品已获批上市。


科技巨头
科技巨头公司动作也频频加码可穿戴医疗设备行业,且成绩表现不俗。根据市场调研机构IDC近日发布的第三季度全球可穿戴设备出货量报告显示,华为在腕上穿戴设备细分领域在2021年Q3的出货量与苹果并列全球第一。
2018年,苹果公司的AppleWatchSeries4上就推出了ECG心电图检测功能并获得FDA批准;2021年6月和8月,AppleInc.的移动脉率房颤提示软件和移动心电图房颤提示软件在中国相继获批,意味着Apple公司的AppleWatchSeries产品在中国具备了“心电图”和“脉率”监测功能。
今年8月,华为公司腕部心电血压记录仪、心电分析系统、心率失常分析系统、腕部单导心电采集器4个医疗器械产品进入了优先审批程序公示,将进一步丰富其智能医疗手表监测功能。
除了苹果和华为,目前,包括Garmin、谷歌、索尼、小米、三星电子和华为技术等公司都在激烈竞逐可穿戴医疗设备领域。


血压测量、无创血糖或成新风口
从医疗健康角度出发,血压、血糖、心率、血氧饱和度、体温、睡眠都是衡量个人健康状况的重要指标。
其中心率、血氧饱和度、体温、睡眠指标监测已经成为当下可穿戴设备的基础功能,已实现成熟应用。而血压、血糖测量尚未有优势产品出现,率先取得技术突破的企业,或将建立起竞争壁垒。


血压测量
利用可穿戴设备进行血压测量是一个世界性的难题,其难点主要在于测量的精度要求上。目前市面上的便携式测血压设备中,并不是直接测量血压,而是测量血压变化,并没有办法像袖带测量一样得到血压的绝对值。
加入精确血压监测功能,毫无疑问将在同质化严重的产品中脱颖而出。2021年以来,三星、华米、华为等头部品牌陆续将血压监测功能引入到可穿戴设备中。其中华为WatchD将在今年12月23日推出,除了现代智能手表提供的常见功能外,新的WatchD还具有精确的血压监测功能。


无创血糖
糖尿病患者每日必备的数次血糖检测需要通过采集血液获取,用户体验不佳且存在一定的感染风险。因此,业界一直在努力通过无创方式实现血糖监测,但难度较大,在这一领域进展并不明显。
此前华为发布的HUAWEIWATCH3虽然新增了微创血糖检测管理,但仍需要搭载专业健康机构血糖监测软件并连接微创式传感器(单独购买)才能查看血糖数据。另一巨头苹果则有望率先拿下这一技术。据了解,苹果主要的传感器供应商之一——硅光子芯片和模块供应商罗克利光子(RockleyPhotonics)在2021年7月宣布即将研发出无创血糖监测传感。
随着大数据人工智能、新材料、微型传感器、无线低功耗传输等技术的迭代发展,可穿戴医疗设备已实现产品形态、准确度等多方面的突破。因此在行业即将进入快速发展阶段,探索更为丰富的功能,也成差异化竞争的焦点。

使用人越多,数据采集越多样化,结果就越准确。未来中国不同地域、不同职业的人群如果使用可穿戴设备人群足够多,而且数据都能通过第三方的平台进行交换,那么这会是一场改变中国健康史的革命。

By 物联网圈子Eshare医械汇