大模型神经网络中的数据处理 | 2023年10月20日 阅读模式

大模型神经网络中的数据处理

大模型一定建立在神经网络基础上,也只有神经网络才能构建大模型。大模型不是一开始就以庞大的形态存在的,而是利用开放的程序接口,通过人工干预或机器对数据处理时产生的深度学习,对已存在的程序不断嫁接与扩展而发展成为大模型。在全球,众多知名大型公司都使用大模型处理数据,如Google的Transformer、后来OpenAI的ChatGPT以及进化的BERT等。因为只有大模型才能准确的处理海量数据,而且只有大模型的开放接口才能实现将人类的智慧嫁接到机器智能中去。因此,大模型是人工智能的基础条件。

大模型是人工智能的基础、而神经网络是大模型的基础。如果没有神经网络的逻辑架构,大模型就无法产生。神经网络,顾名思义就是利用生物尤其是人类神经网络结构,组成数据处理逻辑。简单来说,当人类需要解决某个问题时,首先会考虑与该问题相关的所有信息,这些信息被集中存储在一个神经元中,通过处理信息集里的相关性信息,人类能够得出结论。然而,信息集里的每个信息可能也出现在其他的信息集中,一个信息出现得次数越多,表明该信息对问题的影响越大,用术语来说,就是这个信息的权重就越高。此外,一个信息集里的信息在其他信息集中出现构成了信息集之间的信息传导,这便是人类思维的联想过程,而联想是人工智能深度学习的基础。

我们可以将人类处理信息的过程转化为计算机的数据处理过程。在人类大脑中,信息存储在神经细胞中,而在计算机中,信息存储在数据单元中。计算机中的数集就如同人类的神经元,所以,我们可以这样理解,在计算机对一个数集的数据进行处理时,会同时考虑被处理的数据在其他数集中出现的概率,以此来决定该数集的结论以及与其他数据集之间的关系。通过多数集再合成数据可以得出智能性结论,因此那些在多个数集中出现的数据都会被赋予较大的权重。

另外,在数据处理中,每个数据子集都必须处于收敛数域中。以更形象的方式来解释,就像我们人类在处理问题或事情时,不会没完没了地把所有大大小小的细节都考虑进去。相反,我们会根据事情的相关程度进行取舍,这就是为什么人们常说 "这个事情不考虑" 或 "这个事情影响不大"等等,这样做的目的是将一个问题或事情隔离出来,以便更容易处理。同样的道理,计算机在进行数据处理时也需要确保数据子集处于收敛的数域中,才能得出计算结果。

目前,世界上的大型数据处理公司,例如Google、微软控制的OpenAI、ChatGPT以及Facebook等,都使用大模型神经网络来处理数据。因此,出口企业,尤其是那些使用Google和ChatGPT这样的大型数据处理公司做国际市场销售和国际市场营销的企业,应该从大模型神经网络的数据处理逻辑出发考虑产品数据的开发和应用!


商务部部长:中美双方发展进步完全可以成为对方机遇而不是挑战

2023-10-11   来源: 新华网

新华社北京10月10日电,记者10日从商务部获悉,商务部部长王文涛9日在京会见美国国会参议院多数党领袖舒默率领的美国国会参议院两党代表团。王文涛表示,中美双方的发展进步完全可以成为对方的机遇而不是挑战,合作是两国唯一正确的选择。

双方就中美经贸关系和共同关心的经贸问题进行了理性、务实的讨论。王文涛表示,中美经贸关系不仅事关两国,也具有全球性影响。两国经济互补性远大于竞争性,中美经贸关系的本质是互利共赢。中方不回避竞争,但竞争要基于国际经贸规则,应是公平、良性的竞争。希望美方精准界定安全边界,避免泛安全化、政治化、工具化。

王文涛指出,中方愿与美方共同努力,秉持相互尊重、和平共处、合作共赢的原则,为两国工商界合作创造良好营商环境,促进双边贸易和投资。王文涛重点就美对华出口管制、投资限制、制裁中国企业、人员往来限制和中国在美投资企业享受公平待遇等问题表达关切。

舒默表示,美中经贸关系对两国至关重要,美国会两党重视与中国的经贸关系,不寻求与中国脱钩,愿与中方加强沟通交流。