由OpenAI 旗下的大型语言模型ChatGPT 所引爆的生成式AI 服务热潮,将世界各国的政府和企业都卷进了AI 的军备竞赛,不仅创建AI 模型的需求正在快速成长,支持AI 运行的各种基础设施,上至伺服器晶片与零组件,下至软件服务公司和云端供应商都连带受到瞩目,甚至进入了供不应求的状态。
作为同样是新兴技术的区块链,在这个未来数十年都至关重要的关键产业中,能不能找到相互加乘的机会?答案是:可以,而且是现在进行式。不过在发掘AI+区块链的组合潜力之前,让我们先来了解到底什么是AI,以及AI 运作的基础条件。
TLDR
・训练AI 模型需要处理海量的数据,因此需要一定规模的运算能力,但因为GPU 关键晶片的产能和封装量能限制,全球正在面临巨大的算力短缺,算力将会是人类未来数年的稀缺资源。
・Akash、Gensyn 和Bittensor 等区块链项目正试图透过分布式算力、基础通用模型、开源计算协议与AI 贡献挖矿来解决这个问题。
什么是AI:算法+算力+数据
AI(Artificial Intelligence),所谓的人工智慧,是一种利用大量的资讯数据训练演算法,让其成果能够模拟人类行为的系统或程式,包括学习、理解、推理、解决问题、语言处理、视觉感知、自主行动等能力等等,终极目标是让电脑能够模仿人类的思维推理过程,并应用在处理各种任务和解决问题上。
目前的AI 技术可以分为以下几个主要子领域:
机器学习(Machine Learning):透过从数据中学习模式和规则,使机器能够做出预测和决策。包括监督学习、无监督学习、强化学习等方法。
深度学习(Deep Learning):深度学习是机器学习的一个子集,使用类似人脑神经元的深度神经网络来处理和理解大量数据,特别适用于图像和语音识别等领域。
专家系统(Expert Systems):专家系统是一种模拟专家知识和决策过程的AI 系统,通常用于解决特定领域的问题。
自然语言处理(Natural Language Processing,NLP): NLP 是一个处理和理解自然语言的AI 子领域,使电脑能够理解、生成和与人类语言交互。
机器视觉(Computer Vision):机器视觉是指使电脑能够理解和解释视觉信息,例如图像和影片。
强化学习(Reinforcement Learning):强化学习是一种通过试错和奖励机制来学习最佳行为的机器学习方法,常见于机器控制和自主决策问题中。
大家最熟悉的ChatGPT 属于自然语言处理的类型,Midjourney、DALL-E、Stable Diffusion 等输入文本输出图像的生成工具则属于机器学习的模型。
目前AI 产业遇到了什么问题?
AI 的演算法通常需要大量的计算资源,特别是在机器学习和深度学习领域。这些演算法所处理的大规模数据集,需要大量的算力(Computing Power)进行复杂的运算,特别是大型深度神经网络模型,如深度学习模型,需要足够的算力才能持续进行训练。
而高性能的计算资源,像是图形处理器(GPU)因为算术逻辑单元的数量远超过CPU ,可以处理更大的数据集,训练更复杂的模型,并在更短的时间内完成任务,非常适合支持AI 这种涉及较多的矩阵或向量的乘法和加法的计算。
熟悉加密货币市场,或者曾经研究过比特币挖矿的人,应该都对算力一词,以及在当代几乎是代表算力的GPU 并不陌生。2017、2021 加密货币的两轮牛市都曾经创造巨大排挤效应,后期甚至出现游戏玩家显卡一卡难求,显卡价格飙升的情况。但如今在比特币挖矿已经不敷成本,以及以太坊POW 转POS 导致显卡抛售潮的同时,GPU 已经找到了下一个新的需求战场:AI 算力。
GPU 生产缺口带来的算力短缺
世界首富Elon Musk 曾经表示:「目前GPU 比毒品更难获得,因为每个人和他们的狗都在买GPU。」
自从由ChatGPT 领军的AI 热潮兴起,算力需求爆发式增长,全世界就一头栽入了GPU 抢货大战,其中最热门的顶级GPU 是由NVIDIA 生产的H100。除了新创企业有需求,云端服务供应商(CSP),龙头企业、学术导向的AI 实验室也都加入争夺行列,微调模型小则需要数十上百张,如果要训练模型,则是以千张为单位起跳。
根据GPU Utils的推估,OpenAI 可能需要5 万颗。Inflection AI 想要2.2 万颗。Meta 可能是2.5 万颗(或者根据消息透露,实际上是10 万张或更多)。Azure、Google Cloud、AWS 以及Oracle 等大型云端公司可能每个需要3 万颗,Lambda 和CoreWeave 以及其他私有云端可能总共需要10 万颗。而NVIDIA 2023 年出货量估计仅有55 万颗。
这还只是台面上知名的几间公司所需(想)要的数字。而制造H100 关键晶片的公司是谁?台积电。
台积电目前因为封装的量能有限,三星等晶片厂的生产成果又尚无法符合NVIDIA 的标准,连带导致H100 处于严重供不应求的状态,到货时间已经排到了2024 的Q1~Q2,订单则是一路下到了2025。
稀缺带动的股价上涨或许让黄仁勋和一众大小股东乐哈哈,但全世界的科技公司和开发者可是因此陷入水深火热。
算力短缺导致运算、训练成本高昂
根据最基本的经济学原理,在供给不变,但需求增加的情况下,特定资源的单位价格必然上涨,这就是目前许多AI 公司的处境,他们通常有两种选择:投资自己的硬件设施,同时牺牲可扩展性(但别忘了,硬件设备目前是稀缺资源),或者选择使用云端商,并支付更加高昂的价格。
估值为10 亿美元的公司Stability AI 就选择了后者,在AWS 上运行由4,000 多个Nvidia GPU 组成的集群,用于训练包括Stable Diffusion 在内的AI 系统,据闻单月的营运成本就超过5,000万美元;OpenAI 旗下的产品ChatGPT-3 使用的1,000 个Nvidia GPU 进行训练,成本同样高达1,200 万美元。
这样些高昂的成本不只让既有的AI 公司成长受限,也让既没有本钱投资硬件设施,也无法支付高昂云端成本的后起公司或新创产品和服务,难以开发产品或加入竞争。
封闭模型造成的训练效率低下
在过去,有许多研究AI 的大型机构是非营利研究组织,试图以造福全人类为最终目的推进人工智慧,当年的OpenAI 就是其中之一。但现阶段大多数由利润驱动的AI 产品的公司,虽然正在从全网络上获取(窃取?)文字和图像数据,或者是基于隐私考量,多是在封闭的系统内训练自己的私人模型,相当于每个人都关起门来,从轮子开始从头做起。
这样一来不仅大幅提高了研究和开发的门槛,也导致相关产业可能会逐渐走向被大公司把持、垄断的趋势。
高成本+低效率的可能解方:去中心化的分布式算力+开放的计算网络
目前大型人工智慧系统所需要的算力,几乎每隔几个月就会翻涨一倍,根据国际数据公司(IDC)最新的AI半年度报告,2023 年全年度AI 系统在软件、硬件与服务的综合支出将来到1,540 亿美元,预估在2026 年会达到将近一倍的3,000 亿美元,增长率远高于其他产业。再加上硬件资源的限制,再再凸显了产业对更高效、更具成本效益的解决方案的迫切需求。
Open AI 的创办人之一Sam Altman 曾经预言「大模型时代即将终结」,因为持续扩大模型尺寸不但意味着无限增长的的成本,拓展数据中心和硬件资源也有其物理极限。
面对全球各地指数型上升的算力需求,除了快一步投入资源争夺战,也有人将AI 从资料存储>数据预处理>模型训练>模型微调>模型部署等不同环节拆开检视,试图分头优化,并善用区块链去中心化的技术提出了几个可能解方:分布式算力、开放的计算网络。
AI 人工智能+Crypto 区块链项目介绍
看到这里,相信你已经初步了解到未来数十年的关键产业AI 当前正面临的问题,笔者将进一步介绍区块链上有哪些项目试图解决这些问题。在这之前,我们还需要简单了解一下两个关键名词。
训练成本:训练模型所需的资源、计算能力和数据的成本。在训练阶段,需要根据数据集特有的讯息来调整模型,以提高模型的准确性,并最大限度地减少错误。
推理成本:是指训练完成,并将模型托管部署到某个地方后,运行模型和处理新的输入数据所需的资源,也就是用户输入文本并调用模型来回答或解决问题的阶段。在通常的情况下,任何以合理的规模训练和部署的模型,推理成本会远远超过训练成本。
接下来,我们挑选了一些在AI 赛道较为著名的解决方案,为大家介绍他们的融资背景、产品特色与近期动向。
Akash:去中心化云端算力网络
Akash在古老的梵文当中意思是「开放空间」或者「天空」,而天空是云朵交会之处。Akash 是由云端与工程领域出身的一对创业搭挡Greg Osuri 与Adam Bozanich 在2015 年创立的云端算力市场。在2020 年由Cypher Capital 领投,Infinite Capital 和Digital Asset Capital Management 参投,至今共获得200 万美元的融资。
Akash 是全球首个去中心化云端算力市场(DeCloud),主要是将有算力需求的用户,以及有闲置算力可以对外供给的用户或供应商相互媒合,有效的交易算力资源。根据Akash 官方的计算,全球有将近840 万个数据中心有额外的闲置资源尚未受到充分利用,而任何选择在传统云端如AWS、GCP 和Azure 上运行的容器和应用程式,都可以用1/3 ~1/8 的成本托管或部署在Akash 上,并以更快的速度运行。
根据Grand View Research 的统计,2022 年云端计算市场高达4,839 万美元,2023 年有望突破3,000 万美元,其中传统云端的三大巨头(AWS、GCP 和Azure )就分食了将近65 % 的份额。而目前也有许多去中心化项目的验证节点和前端是托管在中心化的云端上,因而连带受到中心化云端的延迟和故障受到影响,也有受制于传统云端商而的疑虑,使用Akash 网络不仅能实现真正的去中心化,也能在出问提的时后迅速置换到另外一个活跃的算力提供商上。
无论是部署应用程式、竞标出价、租赁算力和结算付款都需要使用Akash 的原生代币兼Gas Fee $AKT,$AKT 也同时用于治理投票、维护区块链网络、奖励质押并鼓励社群参与者。由于Akash 使用的是The Cosmos SDK 的框架,用户需要至少有一个Cosmos 钱包才能使用Akash 相关服务。
过去Akash 的算力租赁业务主要集中在CPU,在2023 年8 月的第6 次主网升级「Supercloud」正式开放GPU 服务,引入GPU 提供商,提供包括NVIDIA 的H100s 和A100s 等顶级GPU,以及能够处理AI 所需的密集计算的消费级晶片,有助于进一步吸引到对AI 训练、渲染和云端游戏有需求的客户。
虽然加密货币市场历经了超过一年的熊市,但在租赁需求持续增加的情况下,$AKT 有着优于整体市场的表现,更持续提供8.37~9.3% APR 的代币质押奖励。
Gensyn:深度学习开放计算协议
Gensyn在2020 年由Ben Fielding 和Harry Grieve 于2020 年创立的去中心化的机器学习计算协议,在2021 年到2023 的3 轮融资之中,获得由A16z 领投,Protocol Labs、Eden Block 等机构参投高达4,980 万美元的资金(这边放一个众VC 的募资图片),用于建构一个开源的基础通用模型,以及一条专门用于深度学习的Layer 1 计算与验证网络,让AI 不被少数的国家或企业寡占,而是趋近真正的民主化,确保每个人都有构建AI 和计算自由的权利。
类似于Akash,Gensyn 将汇集闲置的资源(甚至包括Macbook 和Iphone),让用户在不使用算力的时候可以出租自己的算力协助训练模型,以获得相应报酬,让机器学习计算协议将成为一个无形的网络,提供进入计算革命的下一个规模时所需的基础资源;同时专注于以超大规模和低成本的方式训练神经网络,并建立一组已经经过验证的、预先训练的通用模型,让有相关需求的个人或企业可以使用这个模型做为基础,进行小幅度的微调或进一步延伸训练,大幅降低深度学习的单位成本。
根据官方的计算,Gensyn 可以将每小时的训练成本降低至0.4 美元,并保持高度的可扩展性,远低于使用以太坊进行机器学习的天文数字,以及使用其他传统云端商被收取的高额费用。
Gensyn 目前尚处于相当早期的阶段,不仅尚未发币,也还没进入三大阶段当中的第一个测试网阶段。Gensyn 的初始开发将着重在构建核心技术的和建立测试网,并在测试网迭代成功后将新测试网作为平行链发布到中Kusama Network 上进一步测试,最终将主网以平行链部署到Polkadot 上。
值得注意的是,官方表示测试网使用的代币将是非永久性的,而新测试网的代币将具有实际经济价值。参与测试网的用户将成为社区的早期采用者和核心成员,并在TGE 的时候获得奖励,也就是来自于官方的明牌空投。有兴趣的读者,可以到此官方页面登记申请成为早期用户。
Bittensor:去中心化的机器学习开放协议
Bittensor是由Jacob Robert Steeves 在2021 年所创立的机器学习开放协议,是为了鼓励优化与创新,并解决机器学习中的效率低落的问题而诞生的Layer 1 网络,利用区块链的特性来促进AI 技术的发展。
在过去AI 还没有发展出成熟的产品,尚未受到市场大规模采用时,主要是透过学校、企业以非盈利的方式来资助研究人员,以促进AI 的发展。而在被称为「AI 元年」的2023 年,AI 的研究和开发已经转为由大型科技公司主导,私人企业的封闭性不但不利于整体产业的前进,也让小型的研究员与学术机构难以作出贡献。
而Bittensor 正是为了在当前的情景中持续寻找最佳解而生。Bittensor 链上的矿工透过为特定模型提供专业的情报、知识和技术以加速学习、优化输出来创建更强大的AI 模型,共享成果,并获得奖励代币$TAO,也可以说是AI 的情报市场。
除此之外,Bittensor 创造的特殊协作模式还有助于提炼知识,鼓励开源的模型之间交换讯息互相协作学习,并进一步将汇集的知识压缩到单个模型中,让特定模型更容易部署且训练成本更低。可以说是透过将相关领域的贡献和知识价值货币化,进而成为推动AI 发展的催化剂。
目前如果想要开采$TAO,就必须在电脑本地创建专用的钱包,并针对AI 模型提出有价值的知识和技术贡献,对一般用户来说难度较高。但如果参与代币的二级市场有兴趣,可以在Bitget 等小型交易所购买。
结语:
AI 概念板块无论在Web 2 还是Web 3 都是非常热门的赛道,不过相对于Web 2 已经涨过一轮的整个供应链与硬件设施相关股票来说,Web 3 中AI 基础设施的项目显然都还处于较为早期的阶段,如果你错过了先前由NVIDIA 领头的股市狂欢,这些区块链上的项目值得你及早关注。
除了AI 算力问题的解决方案,诸如我们先前介绍过的去中心化云端储存Filecoin,以及分布式云端渲染的Render Network 也都属于概念上相近的项目,彼此之间有功能上的上下层关系。根据Messari 的基础设施报告,去中心化的储存、算力、数据、无线网络到无线感测网络,加总起来都才勉强超过百亿美元市值,比起文章上半部单单算力就已经估值五千亿的市场,DePin+AI 或许是目前最被高度低估的板块之一!
本文链接地址:https://www.wwsww.cn/rgzn/21442.html
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。