003 ChatGPT认知篇3-ChatGPT的诞生-琪纳米网站

最近无论是国内还是国外，但凡是和互联网沾边的知名企业，几乎纷纷宣布入局AI领域。
像国外的谷歌，国内的百度、阿里、360等等，国内外近一个月也发布了各自的大语言模
型,比如谷歌的bard ,百度的文心一言,阿里的通义千问,都在向ChatGPT发起冲击。
但结果….一个能打的都没有…..
虽说国内几家互联网巨头都说要大力发展人工智能，但说实话,我对此基本上持悲观态
度，不仅是国内，即使是国外像谷歌这样的常年霸占搜索引擎榜首位置的公司,我也不认
为能追上ChatGPT的发展。
照目前的情景来看，只要OpenAI自不作死,那他就是AI领域的iPhone ,对标他的人有
很多,想超越他的人也有很多，但到头来谁也撼动不了他的地位。
为什么会这么说呢?
因为ChatGPT不同于传统的人工智能。
传统的人工智能是什么样的呢?
给你举个例子，你懂鹦鹉学舌吧?
就是那种听别人怎么说就怎么学的，这就是传统人工智能的训练方式，也叫”数据驱动”或
“监督学习”。
就像我们学习一样，人工智能得先学一堆东西,然后慢慢变聪明,大概分六个步骤:
1.数据收集:就像你在学校抄抄写写一堆知识点，人工智能也得收集大量的数据，比如
文字、图片、声音之类的。
2.特征提取:在这堆数据里，要挑出有用的信息。就像学习时提取重点知识点，图像识别时

可以提取颜色、纹理、形状等特征。
3.模型选择:挑一个适合的机器学习模型，就像我们挑一个适合解题的方法。常用的模
型有决策树、支持向量机、神经网络等。
4.模型训练:用收集来的数据训练模型,就像我们做题练习，不断调整模型参数,让它
变得更厉害。
5.模型测试:用新的题目(测试集)测试一下这个模型,看看它有多牛逼，准确度如
何。
6.模型应用:把这个训练好的模型用在实际问题上,帮我们预测和决策。
就想象你在学英语,先背单词(数据收集)，理解词义 (特征提取) , 选学习方法(模型
选择) , 练习(模型训练)，考试(模型测试) , 然后在生活中用英语(模型应用)。就
这么回事儿!
但是ChatGPT的训练方式不再是”鹦鹉学舌”，而更像是“乌鸦喝水”。
你应该学过乌鸦喝水的故事吧，你有没有发现,在这个故事里,从来都没有人教过乌鸦怎
么用石头一点一点喝到水，但是它竟然会!
说得形象一点，传统的人工智能就是,我告诉你这个是石头,这个是水，那人工智能再见
到这两样东西的时候就知道什么是石头，什么是水了。
但是ChatGPT(乌鸦)学会什么是石头,什么是水之后，在没人教的情况下,突然就领悟到
了，可以用石头喝水。
换句话说，ChatGPT就好像拥有了自主思考的能力,能够通过不同的事物之间推理出新的事
物。
这个过程就叫做涌现,在深度学习算法的训练下, ChatGPT突然涌现出了推理的能力，从而
实现了传统意义上真正的“智能”。
而ChatGPT涌现出来的能力,远不止推理能力,还有学习能力、理解能力等等.
这些涌现出的能力让ChatGPT似乎拥有了人类的思考方式，至于为什么是似乎拥有，是因为
我们目前也没办法确定为什么在深度学习算法的训练下，Al会涌现出这些能力，是人为导致

的还是Al自主涌现的，目前还没有定论。
这也是为什么我对其他AI想赶超ChatGPT这件事儿持悲观态度。
因为“涌现”目前不是人为可以复制的，即使你现在让OpenAI在重新开始，从0做出来一个
ChatGPT,他们也未必能做得到。
ChatGPT的诞生本身就是一个概率性的事件,就算你拿到OpenAI的训练数据，丝毫不差地
复制之前的训练流程，也不一定能做到现在这个样子。
更何况对于中文语料来说,很多内容是要经过审核的,作为一个语言模型,大量的内容不
能让它进行学习训练，本身就处于一个劣势。
而摆在面前的困难,远不止这一个，人才的稀缺，大环境的影响,专业的壁垒等等,都是
极难克服的关卡。
不过这又是一个比较大的话题,就留到下次讲解吧。

文章版权归作者所有，未经允许请勿转载。

THE END

科技