(后唐覆灭)
清泰三年,公元936年。
这一年,盘踞在河东的节度使石敬瑭发动叛乱,一举攻灭了后唐王朝,并在后唐的基础上,建立了后晋。
后唐虽然国祚不长,只有十四年,但树大根深,一度是五代十国时期霸主级别的存在,而石敬瑭不过是区区一方节度使,哪儿来这么大的本事,弹指之间就把后唐给收拾了?
他当然没有通天的本领,能覆灭后唐,主要靠契丹人的帮忙。
打不过没关系,咱可以叫外援。
但外援不是免费的,契丹人浩浩荡荡几万大军任你差遣,帮你攻城略地,你总不能一句谢谢就完事儿了吧。
大军一来一回,粮草消耗,器械磨损,过路过桥费,这些你石敬瑭总得给我报销了吧?
契丹人也许要的并不多,但石敬瑭给予的好处,却大大超乎了辽太宗耶律德光的想象。
为了答谢契丹人的援助,石敬瑭为耶律德光献上了两份大礼。
第一,是把燕云十六州割让给契丹,第二,是自降身份,自称“儿皇帝”,尊耶律德光为“父皇帝”,俯首称臣,甘为人下。
燕云一词,最早出现在《宋史·地理志》中,大概是指今天的北京以北,天津以北,河北以北,以及山西北部的一大片广袤土地。
(后晋高祖石敬瑭 形象)
这片土地横亘在契丹领地和中原之间,多是崇山峻岭,山川丘陵,是大自然送给中原王朝最好的防御。
游牧民族善于冲锋,但那只是在平原上,如果中原王朝手握燕云十六州,在战场上就算是掌握了一半以上的主动性。
但现在,石敬瑭把它奉送给了契丹人。
这可算是坏了菜了,自此,中原地区无险可守,彻底地坦露在了游牧民族的铁骑之下。
之后的两宋,频频被辽,金,西夏,蒙古按在地上捶,多半就是因为这个原因。
按说割地已经是奇耻大辱了,但对石敬瑭来讲,似乎还不够尽兴,所以他干脆痛痛快快地俯首称臣,认太宗耶律德光当了干爹,致使后晋彻底沦为了傀儡。
对于石敬瑭的如此行径,如今看来,实在是让人愤慨。
今人如是,古人也如是。
后晋中有一位马步军都指挥使,叫做刘知远,是石敬瑭的得力亲信,这位亲信眼见石敬瑭如此卑躬屈膝的行径,曾经多次劝谏石敬瑭,表示找契丹人帮忙,给点钱就给他们打发了,何必割地称臣呢,你认谁当爹我管不着,但你把如此重要的燕云十六州割让了出去,实在是后患无穷啊。
在当时,这番诚恳劝谏的言论,并没有引起石敬瑭的太多重视,朝臣也多取笑刘知远是危言耸听,但历史却证明了,刘哥实在是个目光长远的人。
(后汉高祖刘知远 画像)
石敬瑭割让燕云十六州,是在清泰三年,公元936年。
而后世收复燕云十六州,是在至正二十七年,公元1367年。
为了收复河山,后世的英雄儿郎们,前赴后继,呕心沥血,居然用了整整四百三十年。
鼠目寸光的石敬瑭当然不会了解这一切,他在后晋王朝里胆战心惊的当了七年的儿皇帝之后,惕然长逝,把皇位传给了自己的养子(侄子),石重贵。
石重贵,即后晋少帝。
石重贵在位的时候,刘知远已经离开了中央,调任河东一带任职。
朋友们,五代十国时期,河东可算是一块风水宝地啊。
后唐太祖李克用是在河东起家,后晋高祖石敬瑭造反之前,也是在河东地区上班,而现在,刘知远到了河东,果然也成了割据一方的封疆大吏。
朝堂上只要有这种级别的权臣出世,那么就必然会有人造谣。
不是权臣遭殃,就是皇帝遭殃。
因为权臣总想着架空皇帝,操持朝政,而皇帝也不会任由权臣发展,一定会想办法打压。
(后晋少帝石重贵 形象)
但在少帝石重贵和大臣刘知远之间,这种关系却并不存在。
年轻的小皇帝初登帝位,根本没有时间搭理刘知远,而是把所有的精力都放到了对外关系上。
所谓对外关系,即为后晋和契丹的关系。
他老子石敬瑭是个卑躬屈膝,厚颜无耻的主儿,但石重贵却是个很有骨气,骨头很硬的人。
他不仅没有维持对契丹称臣的基本国策,反而大张旗鼓地主动出击,想要征灭契丹,洗刷父亲当年割地称臣时的耻辱。
小皇帝石重贵的想法很丰满,但现实却是骨感而残酷的。
你是一个初登帝位,毫无政治背景,也没有战场经验的小皇帝,而不是当年打遍天下无敌手的后唐庄宗李存勖,就算你想要宣誓主权,一雪前耻,你也得掂量掂量自己几斤几两啊?
结果,石重贵搬起石头,砸了自己的脚,后晋军队在正面战场上被契丹铁骑打的是哭爹喊娘,很快,战线崩溃,辽太宗耶律德光带领契丹军队长驱直入,竟然俘虏了少帝石重贵,一举攻灭了后晋。
(辽太宗耶律德光 形象)
开运四年,公元947年,正月初一。
这是新年里的第一天,却是后晋王朝的最后一天。
这一年,辽太宗耶律德光在后晋京师开封城登殿受贺,改元大辽。
辽朝的建立,即代表着一个新时代的开始。
耶律德光前脚灭亡后晋,盘踞在河东的刘知远后脚就知道了消息。
刘知远其人,对契丹人原本就深恶痛绝,当年割让幽云十六州的时候,他就被石敬瑭勾结契丹人的行为气得好几天吃不下饭,所以他对契丹人的态度,只有冷眼,而没有好脸子。
但就算再顶天立地的英雄,也要懂得识时务,河东虽大,可自己手里这点兵力,实在是难以和耶律德光抗衡。
与其正面对抗,自取灭亡,还不如屈身事贼,暂时隐忍。
所以很快,刘知远就派出了使者,向耶律德光请降。
耶律德光对刘知远并不熟悉,在这位大辽皇帝的眼里,这个留守河东的中原人一定是被自己分分钟攻灭后晋的行为吓破了胆,所以皇帝没有多想,不仅开开心心的接受了刘知远的请降,还赏赐给了刘知远的使者不少的礼物。
在这里,我们很有必要提一提这个被派去请降的使者,这个人,叫做王峻。
(王峻 形象)
王峻,字秀峰,五代时期相州人。
王峻不仅完美地完成了刘知远交给他的任务,并且,在契丹人的营中,王峻还发现了辽王朝虽然强大,但内部并不团结,政治混乱,所以一时之间并不能攻取中原,统一天下。
攘外必先安内,辽王朝需要一定的时间恢复内部的完善统治。
所以王峻在回禀刘知远时,他果断建议,趁着辽朝松懈,不如咱们就势发展,成就功名大业。
王峻提出这条建议的时候,大概是在公元947年左右。
这段时间,华夏大地上有南汉,荆南,马楚,后蜀,南唐,大理,吴越,于阗八个。
这其中,吴越,荆南,马楚曾经是后晋的附属,而南汉,南唐,大理,于阗,要么体量极小,要么处在边陲之地,基本上成不了什么大气候。
唯一算得上比较有实力的,就只剩下后蜀。
但问题在于,后蜀虽然很有实力,有能力和辽朝对抗,但后蜀皇帝孟昶是个避世派,消极不出,不爱打仗,只喜欢搞休养生息的民生政策。
如此说来,此时的中原大地,居然没有了真正意义上的主人。
天予不取,反受其咎,既然如此,我刘知远就来当这个主人翁。
(后汉开国)
开运四年,公元947年,刘知远在山西太原府称帝,建国后汉。
当了皇帝的刘知远已经足可青史留名,但他的心情却并不是很好。
燕云十六州被挨千刀的石敬瑭搞丢了不说,此时原属于后晋的大部分疆土也都沦陷在了契丹人的手里。
自己是枭雄的时候,河东对他来说很大,但如今自己已经是一代帝王,又岂肯在这方寸之地了此残生?
但好在,刘知远似乎是个很有运气的人。
如果想要收复失地,就难免要和契丹人硬碰硬,守城容易攻城难,想必刘知远自己也知道,想要一统中原,必然要付出极大的代价。
但该说不说,契丹人自从占据了洛阳和开封的大片土地后,整日烧杀抢掠,导致民心尽失,结果很快被急于扩张领土的后汉军队击退,败退回了草原。
时来天地皆同力,运去英雄不自由。
看来,现在是属于刘知远的时代。
帮刘知远打天下的将领,主要有史弘肇,慕容彦超,高行周,以及郭威,这四个人。
(后周太祖郭威 画像)
相比之下,前三位仁兄当时的身份地位,以及功勋,较最后一位仁兄郭威还要高出不少。
此时的郭威同志,就像当年在石敬瑭手下打工的刘知远一样,默默无闻,并不引人注目。
天是后汉的天,地是后汉的地,后汉军队在中原大地上攻城略地,俨然是要恢复往昔五代的风华和盛景。
但很可惜的是,五代之所以称之为五代,就是因为这个时代并没有全国性的统一出现。
历史早已经为刚刚建立的后汉王朝埋好了引线和扣子,只等待一个扭转乾坤的人,鼓弄风云,掀起新一轮的血雨腥风。
2016年12月23日,北京的树上早就挂起了丝丝条条的彩灯,距离圣诞节还有两天,吹着微微的北风,周五的街道并不冷清。
而在这天,北京海淀的768园区,刘知远带着几个博士生,敲开了知乎合伙人李大海的大门。
不同于今天,智源学者、清华大学计算机系副教授的名号加身,2016年冬天的刘知远,还只是清华研究 NLP 的一个助理教授,虽然有了一些成绩,但仍然算是“名不见经传”。
这次来找李大海,刘知远想要的是“借用”知乎的数据。在知乎,用户的回答更专业,质量也更高——对于 NLP 研究来说,是相当上乘的语料数据。
有人曾把当下互联网范式的转移,形容成从“分发信息”到“分发知识”的转变,知乎作为一个着力传递知识和见解的平台,自然被认为是 AI 2.0时代的“前头兵”。
刘知远博士师从孙茂松院士,后留校清华,从博士算起,他彼时已经在自然语言处理的领域,深耕了十年之久。能得到知乎的数据,自然对研究是如虎添翼。
但数据,几乎算得上是一家互联网公司的“命门”,刘知远早就做好了被拒绝的准备,而李大海的反应却异常地爽快。
2016年冬天,李大海加入知乎不过一年的时间。不同于刘知远在象牙塔一路攀升,李大海自己形容自己,是个“爱折腾”的人,在谷歌和豌豆荚都有过任职。在离开谷歌后李大海一直是创业状态,靠着在工业界深厚的积累,获得了知乎的认同。
早在见面之前,李大海就对刘知远莫名地亲切,不仅仅是因为刘代表的是清华,推动这项合作,本质上推动的是 NLP 领域的产学研结合;也是因为李大海早在谷歌和豌豆荚,就以搜索业务的研发见长,与刘知远所研究的自然语言处理脱不开干系,虽然两人经历迥异,但也算殊途同归。
把刘知远接进办公室,不需多言,李大海就知道,面前的这个年轻学者,务实、客观,对技术路径的判断相当精准。
短短聊了半个小时,李大海和刘知远将合作就=敲定了下来——不需要支付任何费用,一纸 NDA(保密协议)签好,知乎的语料数据就对刘知远开放了。
一晃6年过去,今天李大海的身份,已经不仅是知乎的 CTO,更兼任了刘知远所创办的面壁智能的 CEO,成为了两家公司在大模型方面沟通合作的桥梁。
一、大模型最强的“珠联璧合”说起关注大模型的时间点,李大海的第一反应是“惭愧”。
“我对这件事情经常反思,对我在这个点上的技术判断不满意。”李大海说起这话时,对自己高要求的苛责,几乎写在了脸上。
尽管早在 ChatGPT 在科技圈“激起千层浪”之前,李大海和知乎的算法团队,早就关注到了大模型的可能性, 并且尝试过 BERT 架构的模型,也留意着技术变化的趋势。然而,李大海坦言,直到大模型成为一门显学之前,都没预想过技术的突破会来得这么快。:
“过去,我们把工作重点放在前端的推荐、搜索等业务中,对于大模型主要以应用为主,当然也一直在跟进大模型最新的成果为业务所用。”
在 ChatGPT 强势登场之后,人们惊呼,科技界的下一个“iPhone 时刻”将至。而在几个月的持续观察与发酵之后,人们这才发现,把大模型类比“iPhone”,可能野心太小——大模型很可能是新的“蒸汽机”,带来的机遇不仅限于某个领域,而是全社会大多数领域的重构。
本该早就看到这个趋势,至今想起,李大海仍然觉得遗憾。
尽管一时落后,李大海仍想迎头赶上,让知乎快步追上大模型的浪潮,这时他想起了刘知远。
2018年,应和着 BERT 的出现,刘知远和团队就开始做预训练,后又和唐杰、文继荣、黄民烈三人一起,在智源开展大模型的研究,是中国第一批开展大模型研究的研究者之一(关于刘知远、唐杰、文继荣、黄民烈等人的大模型研究故事,后续雷峰网还将推出《大模型产学研的前世今生》, 讲述四位学者的大模型梦,以及他们与阿里、华为等大公司的合作和在AGI浪潮到来之前,与其他大模型创业公司的参与度,敬请期待)
而刘知远在2021年创办的面壁智能,不仅有多年来留下的技术积累,而且已经训练出他们自己的大模型 CPM-Bee,并且开放了 API。
23年2月,知乎和面壁谈过初步的合作后,李大海回到知乎,就紧急地开展了一次技术评估,把面壁的代码——无论是训练还是推理——都看了一个遍,又评估了面壁的模型 API,跑了大量的问题,最终测试结果出人意料地好。
彼时,大模型的人才争夺战刚刚打响,面壁收到了好几家公司的诚心邀约,最后选择了与知乎合作。
谈到和面壁最契合的地方,李大海说,知乎和面壁的团队,最大的共同点是,大家都是相信技术的人——相信技术能改变世界,如此也就更纯粹,讨论问题时更加实事求是。
与面壁合作,知乎并非“只出钱不出力”,自从大模型起势,知乎也快速组建了大模型的团队,与面壁团队一起进行深度共建。知乎参与过大模型相关项目的开发的人员数也不少。
除了出技术,知乎也为面壁提供管理上的协助——这样的协助,莫过于李大海的“肉身”加入。
2023年的面壁,苦 CEO 久矣——成立一年半,面壁的团队绝大部分成员仍以工程师构成,对于一个初创团队来说,全员极客、专注开发的路线并没有太大问题,但牵涉到后续的融资、战略等问题,面壁的成员没有经验。
而李大海加入知乎已有8年,除了作为 CTO 为公司规划技术路径,也作为执行董事深度参与了公司的战略层决策,并且他也有合伙创业的经验,对于面壁来说,是极为合适的 CEO 人选。
获得了知乎创始人、CEO周源首肯,李大海来到了面壁出任 CEO,一方面帮助面壁更好地做战略的规划和制定,一方面也让知乎和面壁的战略合作更加紧密,算是两全其美。
有李大海的工程化和管理经验,也有刘知远作为国内顶尖 NLP 专家的技术实力;有知乎的活跃社区和优秀语料,也有面壁在大模型训练和开发上深厚的积累,这两家公司的合作,可能促成了中国大模型最强大的一桩“珠联璧合”。
二、“千模大战”中,知乎靠什么突围?说完“纸面实力”,知乎和面壁的核心优势在哪里?
影射多年前的“千团大战”,越来越多人开始用“千模大战”来形容今天大模型赛道的竞逐——行业普遍认为,尽管做大模型需要投入大量资源,但由于大模型的结构不存在秘密,算法已经不构成企业壁垒。大模型“有门槛、没壁垒”的特点,使得诸多”跑步进场“的团队一边倒向 C 端类 ChatGPT 的研发,同质化严重、与行业需求差距大等问题开始显现。
而从另一个方面看,如果将AI时代的大模型比喻成电气时代的电力,当人们认识到电力的价值,之后会有水电、风电、核电等多种多样的“发电手段”不断演进,不断降本增效;未来的大模型也是如此,比拼的核心是成本和效率,竞争的重点是应用和生态。
这一点从今年上半年国内大模型产品发布的情况也能看出:通用大模型的发布热潮已经回落,近两月来,大模型公司已经迅速将重心从 To C 转向 To B,大模型的落地应用场景、私域数据的储备、技术团队的产品能力成为大模型差异化竞争的关键因素。
知乎和面壁合作的“知海图”大模型,瞄准的也正是知乎的场景和数据与大模型的深度结合。
归根结底,知乎是一家互联网公司,虽然技术上要向大模型倾斜,但大树有根,知乎的根在业务上。
围绕着业务,知乎在数据上的优势也能得到充分的发挥,同时通过提升用户对产品的体验,把公司的“钱袋子”守住。有了更多使用、更多的数据,大模型的“飞轮”也就能更好地飞转起来,再去向 B 端公司推广,也更有底气。
在这样的逻辑下,李大海给知乎大模型,设计了一个“三步走”的战略。
1、第一阶段:用大模型来识别内容,保证标准合规高质量、有人文的社区,一直是知乎最重要的财富,正是依托这个社区,知乎才能持续产出令用户喜爱的内容,进而保持粘性、完成增长。
针对这种情况,知乎大模型的应用场景,首先并不是喧宾夺主地“生成”,而是识别用户产出的内容。
“对我们来说,识别是必须的,”李大海对雷峰网说道,“识别能让我们更精细地理解用户,来支持产品运营同事的工作,进而帮助我们更好地把这个社区建设好。”
除了识别“人”产出的内容,知海图一项同等重要的工作,是检测 AI 生成的内容。
ChatGPT 的登场,让很多人看到了 AI 创作的可能。在知乎上,也出现了不少搬运 AI 创作的情况存在。
而知乎,在创始人们的初心里,仍然是一个“以人为本”的社区。虽然对于 AI 生成的内容,知乎的态度是开放的;但如果一个用户,只搬运生成式 AI 的产出,那对于知乎来说,未免有些本末倒置。
一方面是要识别出这样的账号,一方面也要识别出 AI 生成的内容,做好“AI 创作”的标注,让平台内容标准、合规。
2、第二阶段:用大模型来辅助过滤、筛选信息推荐引擎,常常被不少人认为是可以利用大模型“重构”的技术之一,在技术上也有继承和发扬。
基于对语言更好的理解,来让用户在平台上获得更好的信息获取体验,大模型可以说是“恰到好处”。
李大海原本就是搜索引擎出身,而刘知远也在 NLP 领域有近20年的经历,知乎和面壁在这个领域,可以说轻车熟路。
如果说,大模型在内容识别上的内容,做的大多是“幕后工作”;那么“搜索聚合”在搜索和热榜上的内测,就是知乎 AI 实力“犹抱琵琶半遮面”的一次展示。
在大模型的帮助下,用户能更快找到他需要问题的答案,也能在生成式 AI 的辅助下,节省下浏览诸多答案、归纳总结信息的时间,让用户直接阅读高质量回答的梗概。
知海图的内测还刚刚开始,李大海对雷峰网表示,目前还没有更多的信息透露出来,但预计在第三季度的七八月左右,会有一个阶段性的成果展现。
3、第三阶段:用大模型辅助创作,拒绝喧宾夺主从识别到推荐,第三阶段,知乎对知海图的期待,则是辅助用户在平台上的创作。
李大海表示,知乎做 AI,最终关注的还是,如何让 AI 帮助更多用户在内容上做生产,如何保持社区的高质量,保持知乎原本的味道。
要做到这一点,一方面,大模型输出的内容质量要足够高,让用户能用得方便放心——这是大模型的基本功,知海图要有;另一方面,则是要根据用户个人的语言风格和叙事方式,做个性化的用户助手,帮助每一个用户产出属于他们自己的内容,避免 AI 生成内容的“千人一面。
在今天,知海图的能力已经从 NLP 逐渐像多模态迈进,在5月底的中国国际大数据产业博览会上,知乎和面壁联合推出的知海图,不仅宣布了开始大模型在搜索、热榜上的应用,也同样展示了知海图的多模态能力:
“我们上传了一张小男孩的照片,我们的 AI 不仅能识别出小男孩的主题,也能通过他的面部表情,识别出他愤怒的情绪。”李大海说道。
大模型能做的事越来越多,这也迫使知乎开始思考一个难以被绕过的问题:在未来,人类创作者,会被AI所取代吗?
原先,知乎曾经想过,要不要给知海图也做一个知乎的账号,让 AI 在知乎上回答用户的问题——很多人都有过这个设想,毕竟这和时下生成式 AI 和知乎的产品特性相当契合。
但在深思熟虑后,李大海的态度仍然相当谨慎:
“在我们看来,AI 应该是人的能力扩充,而非替代。有些精品的内容,创作者要2天才能完成,在 AI 的帮助下,我们希望让创作者用2个小时就能产出内容——但这2个小时,仍然还是需要他去自己创作的。”
结语:从2016年冬天,李大海和刘知远初遇,到2023年春天,李大海兼任面壁智能 CEO,六个寒暑的光阴,再两人山上看似没有留下多少痕迹,他们投身的事业却开始汇入时代的洪流。
6年过去,李大海仍然是多年前的那个自己,并不“安分”。早在谷歌业务退出中国时,尽管编制还在,但李大海却决意离开——他要在中国做产品,服务中国用户。
而当大模型浪潮涌来,李大海不动不摇,张开臂膀,拥抱急流。
在知乎,他的精力一门心思扑在大模型上,决心用 AI 2.0 的技术重构知乎现有的技术架构;
在面壁,他得以运筹帷幄,执掌公司在商业和战略的运作,发挥他在技术之外的实力和远见。
而刘知远,在大模型的技术趋势刚刚到来的 2018 年,就已经敏锐地看到了这个趋势,并从 2019 年开始把实验室的研究方向从传统的 NLP 命题中撤出,全面围绕大模型的方方面面展开。
李大海把这赞誉为一种“技术胸襟”——就如同一个技艺高超的马车匠人,第一次遇到了蒸汽火车,多少人难以接受,多少人抱怨,但最早转型的人,往往就能越早占领先机。
知乎和面壁智能,人才密度高,密度背后有优质语料数据、深厚技术底蕴和产品落地场景的支持,已然是一股不能被轻易忽视的力量。
今天,李大海仍然在多年前,与刘知远初次见面时的那个办公室伏案工作。而面壁的团队也同样务实、低调,常常骑着自行车穿过学院路,来到768园区和知乎的团队探讨工作。
这颗在6年前被种下的种子,在大模型的时代终于开花结果。而中国大模型的未来,正是以李大海、刘知远为代表的技术理想主义者和实干者手中,于无声处等待厚积薄发。
经常有人说唐朝是鲜卑帝国,宋朝是沙陀,原来只凭李家和鲜卑人通过婚,赵匡胤的宋皇后有沙陀血统。
赵匡胤剧照
我们先来看看唐朝,隋朝时候在中原的鲜卑人后代就已经被当成汉人看了,已经是和汉人通婚的后裔,而赵匡胤的宋皇后的外公刘知远虽然是沙陀后裔,但史书上也只说他先世本沙陀,他已经是个完全汉化了,而且中国历史上也没把沙陀建立的王朝当成异族看,况且除了文化,人是随父系的,不管怎么着都和少民很难扯到一块去?难道因为有一点少民血统,就不是汉人?那么元朝是不是能说成是高丽王朝,因为奇皇后是高丽人,清可以说成 蒙古人 或者汉人的因为满清皇帝有满蒙汉血统?
赵匡胤剧照
无论唐朝是鲜卑,宋朝是沙陀也好。但是他们都是在中华文明融合体系中。都是围绕华夏(汉)融合的。现在都是汉人。我们现在有多少汉人以前根本没有华夏基因的。华夏也是从不同部落融合壮大的。根本说不清谁才是华夏直接嫡系。总之我们是不同部落民族接受中华文明融合的共同体的群体。基因大部分还是有联系的。
赵匡胤剧照
鲜卑的汉化是最彻底的,全世界也难找这么倒贴的民族融合。唐朝时全国各地的民风都还是比较彪悍的,汉人共主的地位是它合法性的来源之一,从法律到文化都全面向汉人靠拢,五万首全唐诗翻开一页都是汉军汉皇破逆胡之类的诗句,这还不算被满清删的,现代人是没文化到何种程度。
不过从现代人的角度来说,鲜卑唐,沙坨宋是完全符合现代人的的观点的对此你是怎么认为的呢?欢迎在文章下面评论留言!