他放下记号笔,转过身,看着台下。
“这些数字,是根据未来五年国防科研的需求倒推出来的。弹道计算需要更高精度的网格剖分,气象预报需要更大规模的数值模拟,核物理需要更复杂的中子输运方程求解。昆仑1的450兆次,再过三四年,就不够用了。”
台下安静了一瞬。
有人在笔记本上飞快地记,有人皱着眉头盯着白板上那些数字,有人靠在椅背上闭着眼睛在思考。
陈茂林继续说:“除了指标的提升,昆仑2的架构也会有重大变化。”
他拿起记号笔,在白板上画了一张架构图。
“昆仑1是双核心架构,主核心负责计算,辅核心负责冗余校验和状态监控。昆仑2在这个基础上,增加专用协处理器。”
他在图上画了一个新的方块,标注了“协处理器”三个字。
“协处理器负责特定类型的计算任务,比如FFT、矩阵运算、卷积。这些任务在科学计算中频繁出现,用通用核心算效率低,用专用硬件算速度快一个数量级。”
他顿了顿,又画了一个箭头。
“向量长度从64位扩展到128位。一条向量指令,同时处理128位数据,相当于四个32位浮点数,或者两个64位浮点数。指令级并行度提升一倍。”
“缓存一致性协议。昆仑2有64个向量单元,每个单元有自己的缓存。多个缓存同时访问主存,数据不一致怎么办?必须有一套硬件协一来保证各个缓存看到的数据是一致的。”
“存储层级优化。L1缓存、L2缓存、主存、外存,四级存储架构。L1缓存紧贴核心,延迟1-2个时钟周期。L2缓存共享,延迟10-20个时钟周期。主存延迟几百个时钟周期。外存延迟毫秒级。软件要能感知这个层级,把最常用的数据放在最快的存储器里。”
他放下记号笔,转过身。
“芯片工艺,2微米为主,1微米为辅。昆仑1的KL-VU向量运算单元,集成了2万多个晶体管。昆仑2的控制核心芯片,复杂度预计8到10万晶体管。2微米工艺能不能做出来?能做。但良率能到多少?不知道。”
“所以,我们建议推进1微米工艺的预研。昆仑2的第一版流片用2微米,验证架构。第二版如果能用上1微米,那性能就能再上一个台阶。”
他合上笔记本,看着台下。
“时间表。1970年底,完成架构设计。1971年,完成逻辑设计和仿真。1972年,第一版流片。1973年,整机集成。1974年,交付。”
他顿了顿,声音提高了一些。
“这个时间表,很紧。但昆仑1我们从1965年到1970年,五年走完了。昆仑2,我们争取四年。”
掌声落下去之后,台下有人举手了。
是6305厂的陈光远。
他站起来,手里拿着一个笔记本,翻到某一页。
“陈工,我问几个问题。”
“陈厂长请讲。”
“2微米工艺,做8到10万晶体管的芯片,面积多大?功耗多大?散热怎么解决?”
陈茂林显然想过这个问题。
他走到白板前,拿起记号笔,在空白处画了一个矩形。
“以KL-VU为参照,2万个晶体管,芯片面积约5毫米乘5毫米,功耗约2瓦。8到10万晶体管,面积约10毫米乘10毫米,功耗约8到10瓦。”
他顿了顿,在矩形旁边画了一个散热片的简图。
“单颗芯片8到10瓦,风冷不够,必须加散热片,甚至水冷。我们在机柜设计上会预留散热通道,芯片封装也要用陶瓷封装,导热系数比塑料高一个数量级。”
陈光远点了点头,又问了第二个问题。
“64个向量单元并行,总线带宽够不够?总线仲裁怎么做?”
陈茂林在白板上画了一条总线,又在上面画了64个小方块,代表64个向量单元。
“昆仑2的总线,我们计划采用分层总线架构。核心总线,点对点连接主核心和协处理器,带宽足够。存储总线,分成四个独立通道,每个通道带宽500兆字节每秒,四个通道并行,总带宽2G字节每秒。向量单元访问存储时,自动分配到不同的通道,避免冲突。”
他顿了顿,又补了一句。
“仲裁器也要升级。昆仑1的总线仲裁器是集中式,一个仲裁器管所有。昆仑2要改用分布式仲裁,每个向量单元有自己的仲裁逻辑,总线请求在单元之间协商解决,避免单点瓶颈。”
陈光远想了想,点了点头,坐下。
台下又有人举手了。
是哈工大的包康建教授:“陈工,昆仑2的指令集,和昆仑1兼容吗?”
陈茂林摇了摇头。
“不完全兼容。昆仑1的指令集是为21个单元、64位向量长度设计的。昆仑2是64个单元、128位向量长度,指令格式必须变。但是,我们会保持‘源代码级兼容’。也就是说,昆仑1上写的汇编程序,重新编译一下,就能在昆仑2上跑。不需要重写。”
本小章还未完,请点击下一页继续阅读后面精彩内容!
喜欢四合院:我是雨水表哥请大家收藏:(m.xtyxsw.org)四合院:我是雨水表哥天悦小说网更新速度全网最快。