你好,欢迎来到快科报,懂你更懂科技。
当前位置: 首页 - 热点 - 正文

华为数据存储产品线总裁周跃峰:做“数据觉醒”时代的“造纸人”

来源:中国经济网 时间:2024-02-21 03:48 阅读量:13094   
导读造纸术让知识变得廉价,并普及; 知识的记录技术是人类文明发展的基础 中世纪初期的欧洲是知识贫瘠的大陆,究其原因,是因为书本太贵了!在中世纪的欧洲,书是贵族阶层和宗教阶层的专属物。在中国的造纸术传入欧洲之前,欧洲人有两种“纸张”:一种...

造纸术让知识变得廉价,并普及;

华为数据存储产品线总裁周跃峰:做“数据觉醒”时代的“造纸人”

知识的记录技术是人类文明发展的基础

中世纪初期的欧洲是知识贫瘠的大陆,究其原因,是因为书本太贵了!在中世纪的欧洲,书是贵族阶层和宗教阶层的专属物。在中国的造纸术传入欧洲之前,欧洲人有两种“纸张”:一种就是源自埃及的纸草技术,类似今天的“压合板”。这是将一种类似芦苇的植物剥去外皮,切割为狭长的长条,击打和干燥处理。这种纸张在干燥的时候可以千年不腐,但是天气潮湿的时候,纸张容易“散架”。一本圣经,1725页,一个农民需要工作约10几年的收入才能买这样一本纸草制作的圣经。

还有一种是“羊皮纸”,将新鲜的动物皮制作成可以书写的纸是一件漫长而辛苦的工作。一本圣经需要用大约300头羊,对普通大众来说拥有这样一本书更是天方夜谭!贵族阶层,尤其是宗教阶层以此控制圣经的解释权;圣经是法律,贵族也就掌控了权力。10世纪之后,中国的造纸术从阿拉伯传入西班牙,法国人1189年在埃罗建造了第一个纸场,并在随后的几个世纪在其他地方建造了更多的纸场。中国造纸术的到达,才让知识在欧洲变得廉价,并开始普及。这也直接促进了新教改革等历史性变革的发生。

“经验转化成知识,知识被记录”,这是人类文明发展的关键。记录技术的发展,使得人类能够群体性学习和进化。人类在地球上已经出现几百万年,正是基于这种能力,人类文明也就是在近3000年才得到飞速发展!

信息的数字化及其可靠的记录和传播

构成了数字时代的基石

随着电子计算机技术的出现和发展,人类进入了数字时代。电子计算机技术的出现之初是为了解决繁重的数值计算问题。最早的图灵机是为了解决二战中破解德国的军事密码;美国更是用第一代电子计算机来计算火炮的射击图表。

用电子计算机解决问题,首先需要把信息翻译成数字,这样促进了另外两种技术的发展:数据范式和数据存储(把不同范式的数据储存到物理介质中,并确保能被可靠读写使用)。美国“无尽前沿法案”将“Data Paradigm and Data Storage”定为影响其国运的十大关键科学技术之一,可见其重要性。

距离产生美,那是因为信号失真。数据通信技术就是为了让信息在空间无失真地传播。数据存储技术解决的是在时间维度无失真传播信息的问题。任何存储介质的最大天敌是“时间”,时间让人忘记痛苦,背后的根因是因为存储介质的不可靠。优盘放在抽屉,由于电荷泄漏,7年以后逐渐开始出现坏盘;在计算机里面的硬盘,3年以后逐步开始出现磁道坏簇。今天,我们使用算法、硬件冗余和持续维护等手段来确保介质中的信息被永久完整保存,这就是今天数据存储产品的基本功能。

在数字经济日益兴盛的今天,越来越多的数据被记录,被处理,也为此产生新的数据……大数据的出现,我们人类开始隐约感觉到这些数据背后的神奇力量!

AI促进“数据觉醒时代”的到来

大模型的出现是AI技术的一次巨大飞跃。通过结合高效能的GPU和大模型算法,现代AI系统能够在很短的时间内学习并掌握“语料库”里面的知识内容,赋予机器前所未有的学习能力和知识广度。人类传统教育需要花近20年时间培养一个专业学者,现在AI大模型机器训练学习只需要几天就可以让机器掌握同等级别的专业知识,呈现出一种全新的“机器专家”。机器学习效率的提升,让人类对文明进化的加速产生了期待,也对“机器文明”产生了一丝隐隐的恐惧!

但是,别忘了,数字化的语料库是机器学习的基础。缺数据无AI!这是一个“数据觉醒的时代”:

封存在磁带库中的冷数据开始醒来,机器需要读这些冷数据理解历史,归纳经验,也就是产生知识。冷数据需要被随时调用,变成了温数据。

数据不再被随意抛弃,保存时间也变得更长,因为数据的长期价值开始被意识到。冷冻电镜的数据,数字病理切片的数据,保存时间都被要求延长几十倍。这样,有助于挖掘疾病背后的秘密和人类健康的谜题。

数据安全和隐私保护变得前所未有的重要。数据的泄漏,机器训练和推理会使得谁就好似在公共场所裸跑。数据存储的地点也变得更加谨慎。数据是否保存到公有云,这个问题似乎更加容易决策。

我们需要一个数字孪生的世界,让机器帮助我们在数字孪生世界里面学习,工作,然后把结果应用到现实世界。人类如“上帝般”观察这数字孪生世界,满足了人类对于永生的渴望,或许在某种程度上也消除了人类文明与生俱来的孤独感。

数据范式可以解决现实世界的数字表述,也即孪生表达问题;但是数据存哪里?因为数据太多了!一个人的全基因组需要3GB数据;一个猴脑的细胞和对应基因的全信息需要300TB数据。今天,我们最便宜的数据存储设备价格大致是每TB约500元人民币,还不算电费。数字孪生,需要解决数据“存得下,存得起”的问题!

我们的目光再次回到发明造纸术的中国东汉,我们的祖先为人类发明了便于知识记录与传播的纸张。AI时代,数据觉醒,信息存储的挑战再一次出现在人类面前,存储也亟待一场技术革命,让人类有更加好用的“纸张”,这样才能驾驭数据!

数据觉醒呼唤新时代的造纸人!加油吧,人类!

免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。

为您推荐