ChatGPT可以用来安全审查吗?GPT-4可查出以太坊漏洞,但无法取代人工

近期,人工智能技术在全球范围内引起了不小的热议,其中最引人注目的话题莫过于ChatGPT。这项技术在区块链领域也引起了不少关注和争议。从最基本的「问答」到简单的行情分析,甚至是量化策略,ChatGPT在区块链领域的应用不胜枚举。

上周,ChatGPT 的升级版本GPT-4 正式上线,该版本比ChatGPT 拥有更加强大的功能,已达到「人类表现水平」。值得注意的是,GPT-4 不仅能够成功地监测出以太坊智能合约中的漏洞,甚至提出了利用漏洞的潜在方法。

由此,OpenAI ChatGPT技术检测安全漏洞的能力成为了圈内最热门的话题之一,不少人开始关注这项技术是否真的能够发现区块链应用的安全漏洞,它的准确率有多高?ChatGPT 真的可以用来安全审查吗?Coinbase为了回答这些问题,快速开展了专项研究。

ChatGPT 的升级GPT-4

上周,ChatGPT-4正式上线,其开发商OpenAI表示,「ChatGPT-4在各种专业和学术基准测试中拥有人类水平的性能」。

OpenAI表示,GPT-4生成的答案错误更少、正确性比GPT-3.5高40%,也较不会超脱常轨、大聊禁忌话题,在许多标准化测验的表现甚至比人类优秀。值得注意的是,GPT-3.5及GPT-4闲聊时差别虽不大,但若任务够复杂,GPT-4比GPT-3.5更可靠、有创意且能处理更多微妙指令。

根据OpenAI说法,GPT-4可在律师资格考试击败90%人类、在国际生物奥林匹亚(Biology Olympiad)击败99%高中生。事实上,GPT-4在至少34种涵盖总经、写作、数学等领域的测验皆名列前茅。

此外,GPT-4 能够成功地监测出以太坊智能合约中的漏洞,甚至提出了利用漏洞的潜在方法,非常具有黑客思维。

ChatGPT-4 检查出以太坊智能合约漏洞

Coinbase主管Conor Grogan得到了ChatGPT-4监测技术的验证,他在社交媒体上表示自己已在该技术中插入了一个实时以太坊智能合约,结果AI瞬间找到了安全漏洞,甚至展示出如何利用这些漏洞进行攻击。Conor Grogan还表示,该合约确实在2018年被黑客利用漏洞攻击。

此外他还尝试了Euler(近来遭骇的DeFi协议) 的智能合约,但由于合约过长而无法被ChatGPT-4处理。他坦言,人工智能技术最终将使智能合约更安全、更容易构建,这也是当前区块链之所以无法大规模采用的两个最大障碍。

ChatGPT可以用来安全审查吗?

那么,这是不是意味着ChatGPT 可以用来安全审查呢?

就在本周二,Coinbase 在其官方博客中正式发布了利用ChatGPT 使用ERC 20 代币审查框架来执行自动审查与区块链安全工程师执行审查的对比实验及其报告成果。

实验的目的是通过将审查结果与区块链安全工程师执行的标准审查结果进行比较,以确定ChatGPT 代币安全审查的准确性。实验中,区块链安全工程师将利用内部工具审查代币智能合约中的每个功能,并根据标记到功能的风险输出风险评分;同样,为了将ChatGPT 的准确性与标准评审的准确性进行比较,也需要ChatGPT 生成一个风险评分。

为了让ChatGPT 使用Coinbase 的ERC 20 安全审查框架生成风险评分,在此之前,Coinbase 需要对ChatGPT 下达部分指令:

「我想让你担任区块链安全工程师。您的任务是根据与其功能相关的风险识别代币智能合约中的安全风险。这是我们的框架[+ 风险框架]。以下智能合约中是否存在这些风险?[+ 智能合约代码]、」如此,Coinbase 便可在ChatGPT 的提示中定义其风险框架,并询问它是否存在任何风险。

那么,ChatGPT 的表现到底如何呢?

Coinbase 在其实验中对比了ChatGPT 和人工安全审查之间的20 个智能合约风险评分,其中,ChatGPT 12 次生成了与人工审查相同的结果。然而,在另外8 次失误中,有5 次是ChatGPT 错误地将高风险资产标记为低风险资产。

看似表现还可以,然而我们都知道,低估风险评分的后果比高估风险评分更加严重,可能就因为一不小心的低估风险导致上架部分高风险币种,这将严重危害交易所以及用户的权益。

根据实验结果所得出的报告显示,ChatGPT 只能说「浅」具备了快速评估智能合约风险的能力,但并不符合Coinbase 安全审查流程中的准确性要求:

首先,ChatGPT 无法识别何时缺少上下文来执行稳健的安全分析。这会导致覆盖缺口,额外的依赖项并未被审查。为了防止任何覆盖缺口,每次都需要对ChatGPT 的审查范围进行初步的分类。

其次,ChatGPT 的输出可能不一致。当多次对ChatGPT 输入同一个问题时,并总是输出相同的答案。ChatGPT 似乎也受到代码中注释的影响,并且似乎偶尔会默认注释而不是函数逻辑。

最后,OpenAI 继续迭代ChatGPT 版本,导致额外的输出不稳定。过去可能用于提供一致输出的详细提示可能会在版本更改后产生替代输出。可能需要及时维护和输出质量控制,以确保一致的响应并避免任何操作故障。

综上所述,或许,Coinbase 可以通过进一步工程设计,提高ChatGPT 代币安全审核的准确性。不过目前,Coinbase 依旧无法仅单独依靠ChatGPT 来执行安全审查。

Coinbase 希望未来可以提高其准确性,将ChatGPT 作为二次QA 检查的工具,从而使安全工程师可以利用该工具执行额外的控制检查,以捕捉可能被忽略的任何风险。ChatGPT 提示将被保存以供工程师将来使用,并计划在以后进行改进。

因此,正如Coinbase 的实验一样,我们可以通过调节ChatGPT 的指令设计来进一步提高其准确性,但是对于安全审核这样偏机动性的工作而言,单靠ChatGPT 使无法保证能在变量无法统一的情况下做出准确判断的,仍然需要进行人工干预,根据具体额外的控制检查来改进ChatGPT 的提示。

结语

总得来说,在区块链行业引入AI,无疑给圈内创企提供了通过人工协作AI 进行高效build 的可能——ChatGPT 拥有广泛的知识库,人工输入特定的业务逻辑和提示,而开发人员可以通过使用ChatGPT 在更短的时间内完成更多的工作。此外,对于安全工程师对智能合约审计的高成本而言,ChatGPT 提供了一种及时且经济高效的合约审计辅助。

就像在ETHDubai 会议上,区块链开发人员Salman Arshad表达的那样,「ChatGPT 和AI 工具是福音;他们不是我们的敌人,也不是用来结束开发者职业生涯的。」ChatGPT 的协作性质,与自动化流程和取代人工的潜在威胁相比,或许对于广大用户更有利。从更大的角度来看,AI 工具已经成为区块链行业快速发展的催化剂,关键在于我们如何运用AI,充分发挥其潜能,为行业创造更多的增值。

本文链接地址:https://www.wwsww.cn/yuanyuzhou/17121.html
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。