日立的CMOS 退火技术是怎样的一种技术利用该技术的半导体计算机是否能够替代量子计算机.docx
- 文档编号:8981916
- 上传时间:2023-02-02
- 格式:DOCX
- 页数:11
- 大小:23.26KB
日立的CMOS 退火技术是怎样的一种技术利用该技术的半导体计算机是否能够替代量子计算机.docx
《日立的CMOS 退火技术是怎样的一种技术利用该技术的半导体计算机是否能够替代量子计算机.docx》由会员分享,可在线阅读,更多相关《日立的CMOS 退火技术是怎样的一种技术利用该技术的半导体计算机是否能够替代量子计算机.docx(11页珍藏版)》请在冰豆网上搜索。
日立的CMOS退火技术是怎样的一种技术利用该技术的半导体计算机是否能够替代量子计算机
日立的「CMOS退火」技术是怎样的一种技术?
利用该技术的半导体计算机是否能够替代量子计算机?
【章木的回答(167票)】:
谢邀。
终于有时间写这个答案了。
和我导师合作的京都大学科学家出席了这个会议,所以我联系他专门讨论了一下CMOS退火。
先给结论,CMOS退火是一项非常了不起的研究。
但CMOS退火不是量子过程,也不能替代量子计算机(没有量子过程就不可能有量子计算功能)。
但CMOS退火对解决部分组合优化问题很管用,这原本是Dwave擅长的领域。
最初看到这个新闻还是在知乎上被邀请。
知乎用户群对这些技术进步反应的确相当快。
我初读新闻的时候也吓了一大跳,还以为一夜之间就量子计算革命就到来了。
我以为我马上就能投入业界成为第一代量子算法兼机器学习工程师了。
后来发现我还是想多了。
。
简单对比一下CMOS退火和Dwave计算机的优劣。
CMOS退火有2万个比特;最新的Dwave只有1024个比特。
CMOS退火室温都能运行,稳定性极好;Dwave要屏蔽外界电磁场干扰,在20mK(零下273.13摄氏度)温度下才能工作。
CMOS退火用成熟稳定的半导体技术,第一代就做到60nm工业级水平;Dwave还是只能用昂贵的超导环,需要冷却到20mk才能正常工作,整个系统一千万美金1台,还老出毛病。
CMOS退火随机性来自SRAM和芯片外部环境;Dwave随机性来自quantumfluctuation。
CMOS退火这种非冯·诺依曼型计算机用处理器在解决组合优化问题时,能耗比经典计算机低很多,但计算时间和经典计算机是一个量级的。
Dwave在时间和能耗上表现都好很多。
伊辛模型的哈密顿量长这样。
这是Dwave128比特芯片的示意图。
每一个黑点就是一个超导环,电流流向决定自旋取值+1/-1,连接i比特和j比特的黑线表示一个Jij。
这是Dwave128比特芯片的示意图。
每一个黑点就是一个超导环,电流流向决定自旋取值+1/-1,连接i比特和j比特的黑线表示一个Jij。
CMOS退火的芯片和Dwave一样都用了伊辛模型(IsingModel),但是CMOS退火里比特间的耦合作用J只能取值+1/0/-1三个值,而且非常稀疏,几乎是只有相邻比特有稳定的耦合作用。
所以,CMOS退火只能解决部分简单的组合优化问题,对于机器学习和人工智能而言,CMOS退火计算没有太多实用价值的。
Dwave芯片的耦合要好的多,而且每一代性能都在提升,能应用的机器学习场景也越来越多。
日本已经决定在东京建造世界上最强大的Dwave系统量子计算机。
靠比Dwave公司更强大的人力财力和精密加工能力建造三维构造的Dwave芯片,比特耦合能力和量子比特数都会远超Dwave公司的产品。
现在的量子算法研究情况有点像很多年以前,写好了程序要到去机房预约计算机才能运行。
以后的环境应该会越来越好了,越来越多的科研人员有机会亲自使用量子计算机。
前面解释了CMOS退火的优劣,以及为什么不能替代量子计算。
日立的“CMOS退火”技术是怎样的一种技术?
这个问题上面的答案解释的很详细了。
我在下文只做一下简单的补充。
1)
量子退火(QA,QuantumAnnealing):
不同于经典模拟退火算法利用热波动来搜寻问题的最优解,量子退火算法利用量子波动产生的量子隧穿效应来使算法摆脱局部最优,而实现全局优化。
量子退火就逆天了,清醒的销售员在C城市时学会了量子隧穿,瞬移到了B城市去看看那边可不可能是最优解,是的话就回去走B路线,不是的话继续从C出发。
@薛矽这个比喻有两个问题,有点太勉强了。
i)我们搜索的是路径,不是城市。
ii)量子退火是:
一开始我们的销售员处于n(~2^N)个态的叠加,是同时选择了所有路径叠加态。
你可以设想这个销售员有2^N个分身。
每一个分身都处在一个路径上,对应一个量子态。
然后,系统开始幸运,高能量的分身一点点转移到低能量态(每个分身的权重系数的演化是连续的)。
到最后,所有的分身都汇聚到基态上,找到了最优化的解。
我们只有波函数,没有具体的点,所以不是一个销售员在一个路上。
是无数个销售员分布在每一条路上。
所谓的量子隧穿效应实际上说的是,销售员的某个态可以跃过相邻的高能量态到基态。
计算时间是:
t~h/ΔE,h是普朗克常数。
2)为什么量子计算和机器学习关联紧密?
量子理论(QuantumTheory)是概率理论。
是一中与自然界量子现象契合的概率模型。
这个概率模型和统计学习理论也是契合的。
量子理论这个重要的物理学理论为统计学习理论和自然界的量子物理现象打起了桥梁。
在这个框架下,两个看起来毫不相干的领域有着深刻的联系,可以被统一描述。
现在我们能制造一台名叫Dwave的量子系统,这就完成了机器学习理论到物理世界的映射。
这是没有量子过程的CMOS退火不可能办到的。
基于量子逻辑门的量子计算机与大家熟知的计算机更为接近。
无非是经典计算机有与非门这种不可逆的逻辑门,而量子逻辑门全部都是可逆的(所以不能完成与非操作)。
可逆计算带来的一大优势是接近0的能耗。
量子计算机可以轻松突破散热和能耗给经典计算机带来的限制。
常见的量子逻辑门有:
ToffoliGate/FredkinGate/CNOT/...
由于量子态都是叠加态(逻辑0和逻辑1的任意叠加)。
当我们有N个量子比特时,就能以经典计算机2^N倍的速度作逻辑门运算。
QuantumParallelism就是量子计算强大能力的主要来源。
这更是CMOS退火办不到的。
最后,Dwave绝热量子计算和量子逻辑门的标准量子计算是等价的。
这个结论是我们最近几年才知道的。
【AharonovD,VanDamW,KempeJ,etal.Adiabaticquantumcomputationisequivalenttostandardquantumcomputation[J].SIAMreview,2008,50(4):
755-787.】
附送一个量子退火理论的讲座:
演讲者是西森教授,量子退火算法的提出者。
【薛矽的回答(97票)】:
3-27更:
看到日报上的不少评论,我想有必要先介绍一下CMOS是什么。
半导体行业外的朋友们对CMOS的认知可能是买相机时所了解的相对于CCD的CMOS。
同样在知乎,CMOS这个tag下,也大多是关于相机的提问:
CMOS-话题精华。
此(相机)CMOS(感光元件)包涵于彼(半导体)CMOS(工艺制程)。
CMOS全称互补金属氧化物半导体(ComplementaryMetalOxideSemiconductor),通俗点说可以指一种制做集成电路(芯片)的制造工艺。
我们现在这个时代所用的芯片大多就都是用CMOS工艺(制程)来设计生产制造的。
其实这件事有点像如何向我母亲那一辈的人解释“半导体”这个词。
我刚进大学的时候向母上大人汇报小的从此踏入了高(ban)大(zhuan)上(gong)的半导体行业。
老妈的第一反应就是:
“收音机行业?
你报的不是微电子么?
原来是修收音机啊。
。
。
”好吧,以上是我脑补的对话,不过他们那个时代的确是把半导体作为收音机的代称。
这就是一个很好的以一种材料/工艺代称其某一单一产品的例子。
————————————————————原文如下————————————————————
【多图预警】
坐等量子计算领域的专家@SummerClover大神回答的同时小弟抛砖引玉一下,供大家参考。
首先要说明的一点是:
对是否已经有真正意义上的量子计算机这个问题目前依然是存在很大争议的,也就是说连D-Wave是不是量子计算机都仍然不是定论。
所以所谓“替代量子计算机”这样的问法或多或少会受到质疑。
另外一方面,从量子计算机理论构想这一角度看,日立这次的工作是否能替代未来的量子计算机甚至仅仅只是竞争得过D-Wave也有讨论的空间。
请看日本媒体对相关报道的吐槽:
“标题党的胜利「堪与量子计算机媲美」”。
(目前大陆关于这项工作的网文应该是翻译自日经技术在线的同一篇报道)
那日立的“CMOS退火”技术到底怎么样?
ISSCC2015上的这篇文章绝对是有价值有水平的研究。
最主要的贡献就在于,不仅硬件实现了退火算法的功能,而且是应用已相当成熟,易于量产的CMOS制程。
通俗的说就是在低成本、又不需严苛的外部条件下就有能力完成一件难度很高的事。
日立的“CMOS退火”技术具体是怎么一回事呢?
以下借用24.320k-spinIsingChipforCombinationalOptimizationProblemwithCMOSAnnealing
这篇paper的图表和Slides来做个基本介绍。
一、为什么会有这种计算机
假设今天我们要解决这样的一个问题:
有一位销售员要出差,需要去到下图中小方框表示的那些城市,请问他如何安排自己的行程可以使总路程最短。
在您现在正在使用的经典冯诺依曼架构计算机中,这类问题的算法一般是一步一步的用{if...else}之类进行分析,需要不断的循环往复。
那有没有一种方法可以做并行计算来显著得提高效率?
在您现在正在使用的经典冯诺依曼架构计算机中,这类问题的算法一般是一步一步的用{if...else}之类进行分析,需要不断的循环往复。
那有没有一种方法可以做并行计算来显著得提高效率?
我们身处的大自然中,包括我们人类本身,相对于计算机来说都具有很多“自然而然”的现象。
比如,一个被加热的物体会“自然而然”地冷却,达到一个平衡态而内能减为最小。
又比如人类可以对着照片,“自然而然”地分辩小黑猫大黄狗。
这些能力要经典计算机来实现的话都是极为复杂艰难的,于是科学家们想到了向自然界进行借鉴模仿。
日立的科学家把它们形象的称作“naturalcomputing”。
日立的科学家把它们形象的称作“naturalcomputing”。
Reference[1]是IBM2014年发表在Science上的神经网络芯片(具体可见IBM发布新型SyNAPSE神经芯片,会对整个计算机乃至科技领域产生什么影响?
-知乎用户的回答)。
IBM模拟建构了类似大脑中神经系统的架构来实现模式识别等方面的功能。
Reference[2]就是D-WaveSystem,和日立的这篇文章一样,他们借鉴了电子自旋的易辛模型(Isingmodel)和退火算法来实现最优化方面的功能。
下图右边表示传统的计算架构,左边是“naturalcomputing”的架构思想。
下面这张图即为这一含有spin(自旋模组)的Ising模型芯片在解决CombinationalOptimizationProblem时应用CMOSAnnealing(退火)算法的基本架构与传统计算机的比较。
下面这张图即为这一含有spin(自旋模组)的Ising模型芯片在解决CombinationalOptimizationProblem时应用CMOSAnnealing(退火)算法的基本架构与传统计算机的比较。
(文题“20k-spinIsingChipforCombinationalOptimizationProblemwithCMOSAnnealing”)
二、那这一架构是怎么运行的呢?
首先介绍几种算法:
爬山算法(HillClimbing)、模拟退火(SA,SimulatedAnnealing)、量子退火(QA,QuantumAnnealing)。
仍以销售员的路线安排问题为例,稍作简化:
爬山算法(HillClimbing):
一种简单的贪心搜索算法,该算法每次从当前解的临近解空间中选择一个最优解作为当前解,直到达到一个局部最优解。
就是说销售员每在一个城市的时候都选择去最近的相邻城市,这个算法的缺陷就在于很可能只能得到一个局部最优解。
如在A点起始,最近的是C,然后去F,这样的路线在局部(C路线)中是最短路线,但与先去B的路线相比就长多了,并没有选到整体最优解。
模拟退火(SA,SimulatedAnnealing):
爬山法是完完全全的贪心法,每次都鼠目寸光的选择一个当前最优解,因此只能搜索到局部的最优值。
模拟退火其实也是一种贪心算法,但是它的搜索过程引入了随机因素。
模拟退火算法以一定的概率来接受一个比当前解要差的解,因此有可能会跳出这个局部的最优解,达到全局的最优解。
这就好比销售员失恋了,在A城市的酒吧灌酒到天亮,在做第一个选择时稀里糊涂得随机选了B或C,这样在这个选择下就有一半的机会选到整体最优解。
量子退火(QA,QuantumAnnealing):
不同于经典模拟退火算法利用热波动来搜寻问题的最优解,量子退火算法利用量子波动产生的量子隧穿效应来使算法摆脱局部最优,而实现全局优化。
【极不准确比喻预警,勿信】量子退火就逆天了,清醒的销售员在C城市时学会了量子隧穿,瞬移到了B城市去看看那边可不可能是最优解,是的话就回去走B路线,不是的话继续从C出发。
(我的这个例子好奇怪,哈哈。
详情请移步如何用圈外人士能理解的文字解释「量子退火」?
-物理学)
3-27更新:
如之前所述,这部分的比喻真的太奇怪了,下面引用@SummerClover在上面的回答中的描述以正视听:
@薛矽这个比喻有两个问题,有点太勉强了。
i)我们搜索的是路径,不是城市。
ii)量子退火是:
一开始我们的销售员处于n(~2^N)个态的叠加,是同时选择了所有路径叠加态。
你可以设想这个销售员有2^N个分身。
每一个分身都处在一个路径上,对应一个量子态。
然后,系统开始幸运,高能量的分身一点点转移到低能量态(每个分身的权重系数的演化是连续的)。
到最后,所有的分身都汇聚到基态上,找到了最优化的解。
我们只有波函数,没有具体的点,所以不是一个销售员在一个路上。
是无数个销售员分布在每一条路上。
CMOS退火可以说是介于模拟退火与量子退火之间的一种方法:
一方面和模拟退火一样利用随机数避开局部最优解,一方面和量子退火一样不是一条路走到黑(虽然没有瞬间移动的技能)。
这又是怎么回事呢?
三、架构实现
研究表明,伊辛模型可以在要素数量增加的情况下高效解决组合优化问题。
伊辛模型的每个自旋可实现“向上”、“向下”两种状态。
各个自旋的状态取决于伊辛模型的总能量。
如果仅考虑最简单的、只有两个自旋的伊辛模型,则自旋方向相反时能量低,自旋方向相同时能量高。
对于更复杂的模型,各个自旋会受到上下及前后左右的周围的自旋的影响,改变1个自旋的方向后,其他自旋的方向也会随之改变,使整个模型的能量发生变化。
研究表明,在多个条件下计算模型总能量最低时各个自旋的方向等价于大多数的组合优化问题。
在理想的伊辛模型下,即使不用人工计算最优的自旋方向,大自然——物理法则也会给出答案。
这是因为大自然总是趋向于系统能量最低的状态。
因此,只要构建出将组合优化问题翻译成伊辛模型问题,然后通过物理实验求出伊辛模型的最优解,再将结果翻译回去的系统,就能得到用来解决组合优化问题的新型计算机。
如上图所示的许多个蓝点σ就是每一个spin(自旋点),它们有“上”“下”两种状态方向,每一个点相邻的四个spin的状态如果改变都会影响中间这一点的自旋状态。
对整个系统来说当系统能量最低时稳定,也就是全局最优解的产生。
如下图中σ5与σ2、σ4、σ6、σ8通过系数因子J25、J45、J58、J56相互影响变化状态。
这样每一次都会有总数的1/8的spin同时更新,大大减少运行时间。
拓扑结构如下图所示:
3D的晶格结构被平面化成二位的记忆体阵列。
算法介绍部分中提到的随机因素的引入如下图所示:
应用多数决(粉色模块)和条件反置(黄色模块)引入随机参数。
如果+1(相对于memory中的值0)的个数多于-1(相对于memory中的值1),spin的下一个值变为+1,反之亦然。
具体电路:
另外值得一提的是,日立应用SRAM在供电电压改变的情况下会出现错误数值的特性,降低VDD至0.7V产生误差数从而不时地随机的改变系统的能量状态,避免陷入局部最优的死胡同。
四、量测结果
在解决最大割的应用中,右图显示在5ms(50,0,000次收敛)后测试字母初露倪端,在10ms(1,000,000次收敛)后测试字母清晰可见。
左图显示在不断变化供电电压(从a、c的1V降到b、d的0.7V后重新迭代收敛),测试字母越来越清晰,越来越接近全局最优解。
与传统计算机的比较(这里作者是在解同样应用问题的情况下与由1.87GHz10W/core的Corei5组成的系统上run相似的“SG3”算法作比较得到的结果):
与传统计算机的比较(这里作者是在解同样应用问题的情况下与由1.87GHz10W/core的Corei5组成的系统上run相似的“SG3”算法作比较得到的结果):
极大地提高了能耗效率。
与D-Wave的比较:
CMOS制程在应用温度、能耗、可款扩展性方面的优势尽显。
但是与基于量子退火的D-Wave相比速度的差距确令人怀疑。
另外存疑的一点是,SRAM在供电电压改变的情况下出现错误数值这一特性在多大程度能被很好的控制。
与D-Wave的比较:
CMOS制程在应用温度、能耗、可款扩展性方面的优势尽显。
但是与基于量子退火的D-Wave相比速度的差距确令人怀疑。
另外存疑的一点是,SRAM在供电电压改变的情况下出现错误数值这一特性在多大程度能被很好的控制。
最后po一张含20K个spin的芯片的玉照:
最后po一张含20K个spin的芯片的玉照:
如果问利用该技术的半导体计算机是否能够替代传统计算机?
答案是不会,各司其职。
这和量子计算机、类神经计算机一样都是在大量数据的并行处理方面(这点可能不太准确)有优势,但在一些日常的一般应用中甚至会比传统计算机慢很多,术业有专攻。
比如日立的这款芯片可应用的场景举例:
这里主要提到的都是物联网方面的应用,因为这篇paper被分到了Session24:
Secure,EfficientCircuitsforIoT(InternetofThings),这也是很有意思的一件事。
这里主要提到的都是物联网方面的应用,因为这篇paper被分到了Session24:
Secure,EfficientCircuitsforIoT(InternetofThings),这也是很有意思的一件事。
感谢阅读,如有错误之处,恳请指正:
)
ps:
国内在量子信息领域有很高的研究水平,中科大的郭光灿院士、潘建伟院士都是世界级的领域内的大牛。
知乎上量子计算相关的讨论很多,趁机说一点感想。
量子计算机不仅是听起来看起来相当高大上,而且是真的高大上,以至于一直没有实体机器的实现。
如果有对这个研究方向感兴趣的知友建议先找机会多接触,真正地了解一下现状。
如果真的感兴趣做研究那真的是好事。
这个方向适合搞科研,好发文章,但并不太适合就业。
因为大学的时候做过一年多量子电线方面的大学生创新实验感受很深,有一位学长通过老师和科大的合作去了院士组里跟着做,本科就有了Science还是Nature的发表(好像不是一作),后来也顺利进了那边的重点实验室。
但是同期一起做这个方面的同学后来都没有选择继续深入发展。
原文地址:
知乎
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 日立的CMOS 退火技术是怎样的一种技术利用该技术的半导体计算机是否能够替代量子计算机 日立 CMOS 退火 技术 怎样 一种 利用 半导体 计算机 是否 能够 替代 量子