论文登计算机体系结构顶会 芯片架构成为边缘AI最佳并行计算选择

机器之心发布

机器之心编辑部

AI 大模型的爆发带动了 GPU 的强劲需求,从云端到边缘渗透的 AI 应用也将带动边缘 AI 服务器及加速处理器的需求。通过对比 GPGPU、FPGA、NPU 和 ASIC,可重构计算架构 CGRA 成为最适合边缘 AI 的并行计算架构。由芯动力提出的可重构并行处理器(RPP)是比传统 CGRA 更适合大规模并行处理的计算架构,这不但通过试验评测得到证实,而且也通过 ISCA 会议得到国际学术权威的认可。基于 RPP 架构的 R8 芯片及后续更高性能的迭代芯片将是边缘 AI 服务器和 AI PC 的理想 AI 加速处理器选择。

目录

一、什么是边缘 AI?

二、边缘 AI 服务器市场趋势

三、适合边缘 AI 的理想计算架构

四、RPP 架构详解

五、RPP 处理器 R8 能效对比

六、RPP 处理器到国际学术权威认可

七、结语

一、什么是边缘 AI?

边缘 AI(AI Edge)是人工智能 (AI) 与边缘计算交叉的先进技术,这一概念源于 AI 从云端向边缘下沉的分布式计算范式转变。边缘 AI 的核心是将 AI 算法直接嵌入到产生大量数据的本地环境中,例如智能手机、物联网设备或本地服务器,通过位于网络 “边缘”(即更靠近数据源)的设备和系统进行实时数据处理和分析。

相对于传统的数据中心或云计算平台的 AI 训练或推理,边缘 AI 的主要优势在于 “就地处理”,大大减少了数据传输和处理的延迟,这在智能监控、自动驾驶、实时医疗诊断或工业自动化控制等应用场景中尤其重要。

实现边缘 AI 计算的设备和系统主要包括:

本文主要讨论边缘 AI 服务器及其市场发展趋势、对 AI 加速处理器的要求,以及适合边缘 AI 应用的并行计算架构和处理器实现。

二、边缘 AI 服务器市场趋势

AI 服务器是指专为人工智能应用而设计的高性能计算机设备,能够支持大规模数据处理、模型训练、推理计算等复杂任务。AI 服务器通常配备高性能的处理器、高速内存、大容量高速存储系统,以及高效的散热系统,以满足 AI 算法对计算资源的极高需求。按不同的分类标准,AI 服务器可以大致分为训练服务器、推理服务器、GPU 服务器、FPGA 服务器、CPU 服务器、云端 AI 服务器,以及边缘 AI 服务器等。

据 Gartner 预测,从现在到 2027 年,AI 服务器市场规模将保持高速增长,年复合增长率高达 30%。该机构发布的《2024 年第一季度全球服务器市场报告》显示,今年 Q1 全球服务器市场销售额为 407.5 亿美元,同比增长 59.9%;出货量为 282.0 万台,同比增长 5.9%。在众多 AI 服务器供应商中,浪潮信息蝉联全球第二,中国第一,其服务器出货量在全球市场占比 11.3%,同比增长 50.4%,在 TOP5 厂商中增速第一。

另据中商产业研究院发布的《2024-2029 年中国服务器行业需求预测及发展趋势前瞻报告》,2022 年末,国内市场总规模超过 420 亿元,同比增长约 20%;2023 年约为 490 亿元,市场增速逐步放缓;预计 2024 年市场规模将达 560 亿元。从出货量来看,2022 年中国 AI 服务器市场出货量约 28.4 万台,同比增长约 25.66%;2023 年约为 35.4 万台,预计 2024 年将达到 42.1 万台。

在 AI 大模型发展早期,AI 服务器需求以模型训练为主,因而训练型服务器占据市场主导地位。目前,AI 服务器市场中 57.33%为训练型服务器,推理型服务器占比达 42.67%。然而,随着生成式 AI 应用往边缘端渗透,预计未来推理型服务器将逐渐成为市场主流,边缘 AI 服务器从出货量上将超过云端训练和推理服务器。

IDC 最新发布的《中国半年度边缘计算市场(2023 全年)跟踪》报告数据显示,2023 年中国边缘计算服务器市场继续保持稳步上升,同比增长 29.1%。IDC 预测,到 2028 年,中国边缘计算服务器市场规模将达到 132 亿美元。

作为边缘计算的重要组成部分,2023 年定制边缘服务器规模已达 2.4 亿美元,相较 2022 年增长 16.8%。从厂商销售额角度来看,边缘定制服务器市场中占比较大的厂商分别是浪潮信息、联想、华为、新华三。随着边缘计算应用的多样化发展,新兴服务器厂商在车路协同、边缘 AI 和智能终端等业务场景和应用市场将有较大突破,使得边缘服务器市场呈现出多样化格局。

三、适合边缘 AI 的理想计算架构

PC 时代由 WINTEL(微软 Windows + 英特尔 CPU)联盟主导、智能手机时代由 Android+Arm 联盟主导,AI 时代将由哪个联盟主导呢?一个新的联盟正初露端倪,那就是由英伟达和台积电组成的 NT 联盟(Nvidia+TSMC)。据华尔街投资专家预测,2024 年 NT 联盟总营收预计将达到 2000 亿美元,总净利润 1000 亿美元,总市值有望突破 5 万亿美元。由云端 AI 训练和 AI 大模型应用驱动的英伟达 GPU 和台积电 AI 芯片制造业务将成为今年最大的赢家。

尽管英伟达在云端 AI 训练和推理市场占据了绝对主导地位,但在边缘 AI 应用场景中英伟达的 GPGPU 却不是最佳选择,因为其计算架构固有的高功耗和高成本问题限制了其在更为广泛而分散的边缘 AI 应用中的作用。计算机架构领域的学者专家都在寻求能够替代 GPGPU 的高能效并行技术架构,基于特定域专用架构(DSA)的 ASIC 设计是一种可行的关键思路,比如谷歌的张量处理单元 (TPU) ,这种专为加速机器学习工作负载而设计的处理器采用脉动阵列架构,可高效执行乘法和累加运算,主要面向数据中心应用。另外一个思路是以三星为代表的神经处理单元 (NPU) ,它专为移动场景而设计,具有节能的内积引擎,可利用输入特征图稀疏性来优化深度学习推理的性能。

虽然 TPU 和 NPU 都能够提供部分替代 GPGPU 的高性能和节能解决方案,但它们的专用设计属性限制了其多功能性和广泛的适用性。总部位于美国加州且在台湾和大陆都有研发中心的边缘 AI 芯片初创公司耐能(Kneron)提出了可重构 NPU 的方案,使得 NPU 芯片有 ASIC 高性能而又不牺牲数据密集型算法的可编程性。凭借独特创新的架构和优异的性能,耐能团队获得 IEEE CAS 2021 年 Darlington 最佳论文奖。耐能第 4 代可重构 NPU 可以支持同时运行 CNN 和 Transformer 网络,既可做机器视觉,也可运行语义分析。与仅面向特定应用的普通 AI 模型不同,耐能的可重构人工神经网络(RANN)技术更加灵活,可满足不同应用需求并适应各种计算体系架构。据该公司宣称,其边缘 GPT AI 芯片 KL830 可应用于 AI PC、USB 加速棒和边缘服务器,当与 GPU 配合使用时,NPU 可将设备能耗降低 30%。

可重构硬件是另一种可提供高性能和节能计算的解决方案,现场可编程门阵列 (FPGA) 是可重构硬件计算的代表,其特点是细粒度可重构性。FPGA 利用具有可编程互连的可配置逻辑块来实现自定义计算内核。这种定制的计算能力使得基于 FPGA 的加速器能够部署在金融计算、深度学习和科学仿真等广泛的大规模计算应用中。然而,FPGA 提供的位级可重构性会带来明显的面积和功率额外开销,而且没有规模成本效益,这极大地限制了其在需要低功耗和小尺寸的应用场景中的适用性。

粗粒度可重构架构 (CGRA) 代表另一类可重构硬件。与 FPGA 相比,CGRA 提供粗粒度的可重构性,例如字级可重构功能单元。由于 CGRA 内部的 ALU 模块已经构建完成,且其互联也要比 FPGA 更简单、规模更小,因此其延时和性能要显著好于在门级上进行互连形成组合计算逻辑的 FPGA。CGRA 更适合 word-wise 类型 (32bit 为单位) 的可重构计算,而且可以缓解 FPGA 存在的时序、面积和功率开销问题,是未来边缘 AI 的理想高性能并行计算架构。

下面我们大致梳理一下 CGRA 的发展历程:

国际计算机学术界和高科技产业界已形成共识,基于 CGRA 架构的可重构计算芯片具备广泛的通用计算能力,可以应用于各种边缘 AI 计算场景,是解决通用高算力和低功耗需求的必由之路。

四、RPP 处理器架构详解

RPP 和 CGRA 都是属于粗粒度的可重构阵列,都可以达到类似 ASIC 的面积密度和功率效率,而且都是可以用软件编程的。但是,RPP 在可重构类型和编程模型方面跟 CGRA 还是不同的,具体表现为:

1. RPP 是准静态可重构阵列,而传统 CGRA 一般用于动态可重构阵列。静态可重构整列是指每个指令在处理单元(PE)的执行不随时间变化,数据流也是不变的。对于编译器来讲,静态的可重构阵列不需要对指令在时间上进行安排,这样就可以让 RPP 构造更加简单,指令的分配速度很低。因此,RPP 很容易实现一个大型的阵列,譬如 32x32 的阵列。RPP 比传统 CGRA 更加适用于大规模并行计算。

2. RPP 使用的是多线程 SIMT 编程模型,而 CGRA 通常使用的是单线程语言编程。RPP 可以兼容 CUDA 语言,更加适合并行计算。CUDA 语言要求编程人员从一开始就考虑数据的并行度,把并行算法用 CUDA 语言表现出来;编译器则不需要分析并行计算度,编译器就非常简单;CUDA 语言是 SIMT 类型,只用于数据并行的计算,而且并行度在一个程序里保持不变。CGRA 则通常使用 C 语言 + 独立的编译器,虽然理论上可以覆盖任意的计算类型,但是编译器非常复杂,很难达到较高的编译效率。

下面图表对 RPP 及几个主流的可重构加速架构做了对比。

RPP 架构的优势可以总结为以下四点:

芯动力基于 RPP 架构提出了 RPP 硬件设计框图,并通过 R8 芯片真实的展现出这种并行计算架构的优越性。这种硬件设计实现主要由一个环形可重构处理器(Circular Reconfigurable Processor)、一个内存单元和一个序列器组成,见下图。

环形可重构处理器包括 NPU 处理单元 (PE) 和一个垫片内存。每个 PE 都配备了一个内存端口,以方便对内存单元进行数据访问。内存端口设计有模式控制器、地址计算单元和多个多路复用器,以支持不同的数据访问模式和共享内存模式。为了实现灵活的处理器内通信,每个 PE 都集成了一个开关盒 (SB) 和一个互连开关盒 (ICSB),以实现高效的数据转发。这些 PE 按线性顺序连接,垫片内存充当第一个和最后一个 PU 之间的桥梁,从而形成环形拓扑。

环形可重构处理器内的数据处理从第一个 PE 开始,并以流水线方式遍历 PE,中间计算结果按顺序输出到后续 PE。垫片内存缓存最后一个 PE 的输出并将它们重新循环到第一个 PE,从而最大限度地提高数据局部性并消除内存单元的内存流量。PE 中的关键计算组件是处理引擎。在每个 PE 中,都有多个算术逻辑单元 (ALU),其中每个 ALU 都与数据寄存器和地址寄存器耦合。这些数据寄存器聚合在一起形成一个数据缓冲区,便于在每个 PE 内快速访问数据。

此外,线性交换网络和垫片存储器的组合实现了灵活的数据流控制和高效的数据重用,同时消除了传统基于网格的 CGRA 设计中复杂的网络路由。结合对内存单元的灵活高效数据访问,RPP 可以优化数据流处理,最小化内存流量,从而最大限度地提高资源利用效率。

RPP 处理器采用 SIMT 编程模型来为灵活多线程管道启用流式数据流处理。

为了确保与现有 GPGPU 软件生态系统的兼容性,芯动力的 RPP 处理器采用了拥有广泛用户群的 CUDA。CUDA 代码由基于 LLVM 的前端解析,为 RPP 后端生成 PTX 代码。RPP 编译器将 CUDA 内核解释为数据流图并将它们映射到虚拟数据路径(VDP)。然后根据硬件约束将 VDP 分解为多个物理数据路径(PDP),每个 PDP 的配置由序列器在运行时生成。

RPP 的软件堆栈可以支持广泛的大规模并行应用,包括机器学习、视频 / 图像处理和信号处理等。对于机器学习应用,该堆栈与不同的主流框架兼容,例如 PyTorch、ONNX、Caffe 和 TensorFlow。此外,用户可以灵活地使用 CUDA 定义他们的自定义程序。这些高级应用程序由 RPP 框架处理,该框架包含一个编译器和不同领域特定的库。在软件堆栈的底部,采用 RPP 运行时环境和 RPP 驱动程序来确保使用工具链编译的程序可以在底层硬件上无缝执行。

五、RPP 处理器 R8 能效对比

基于以上 RPP 处理器硬件设计和完整软件堆栈实现的 RPP-R8 芯片在计算性能和能效上表现如何呢?

R8 芯片的性能参数如下表所示:

针对边缘计算场景,芯动力将 RPP-R8 芯片与两款英伟达边缘 GPU 进行了比较:Jetson Nano 和 Jetson Xavier AGX。Jetson Nano 的芯片尺寸与 RPP 相似,可在物理面积限制内提供相关比较;选择 Jetson Xavier AGX 是基于其与 RPP-R8 相当的理论吞吐量。芯动力在 ResNet-50 推理上评估了这三个 AI 加速平台,其中 Jetson Nano 的吞吐量来自基准测试论文,而 Xavier AGX 的性能数据来自英伟达官方网站。

如上表所示,RPP-R8 的实测运行吞吐量分别是 Jetson Nano 和 Jetson Xavier AGX 的 41.3 倍和 2.3 倍。要知道,Jetson Xavier AGX 的芯片尺寸几乎是 R8 的三倍,工艺也更先进(12 nm vs. 14 nm),但其性能低于 R8。在能效方面,R8 的能效分别是 Jetson Nano 和 Jetson Xavier AGX 的 27.5 倍和 4.6 倍。这些结果表明,在面积和功率预算有限的边缘 AI 场景中,RPP-R8 的表现明显优于 Jetson Nano 和 Jetson Xavier AGX。

深度学习推理是一种广受认可的大规模并行工作负载,也是 RPP-R8 硬件的关键应用。鉴于 Yolo 系列模型与 ResNet-50 等分类模型相比表现出更高的计算复杂度,芯动力选择英伟达 Jeston Nano Orin 作为 GPU 平台,其峰值吞吐量比 Jetson AGX Xavier 更高,为 40 TOPS。由于 CPU 通常不是为高性能深度学习推理而构建的,因此选择 Jetson Xavier Nx 作为比较低端的 GPU 平台,具有 21 TOPS 的峰值吞吐量。评估批处理大小为 1、2 和 4 的工作负载,反映了真实的边缘场景。上图显示了三个平台的吞吐量性能比较,RPP-R8 在 Yolo-v5m 和 Yolo-v7 tiny 上展示了更高的吞吐量。在批量大小为 1 的情况下,RPP-R8 的吞吐量大约比 Jeston Nano Orin 高 1.5× ∼2.5 倍,比 Jeston Xavier Nx 高 2.6× ∼4.3 倍。

评估与测试结果表明,RPP 在延迟、吞吐量和能效方面优于传统的 GPU、CPU 和 DSP 等架构。RPP 处理器的性能提升归功于其独特的硬件特性,主要包括:1) 循环数据流处理:中间结果流经 PE 之间的流水线寄存器和 FIFO,显著减少了数据移动和到远程内存存储的内存流量;与 GPU 和 CPU 中的数据处理相比,这种模式效率更高。2) 分层内存系统:RPP 通过其分层内存系统最大化数据局部性。RPP-R8 芯片面积的很大一部分(约 39.9%)专用于片上存储器。这种设计选择提供了广泛的内存容量,增强了数据重用并减少了频繁访问外部存储器的需求。3) 矢量化和多线程管道:RPP 的硬件架构和编程模型可实现有效的矢量化和多线程管道。这种设计充分利用了 RPP 进行并行处理的全部计算潜力,确保其资源得到最大程度的利用,从而提高性能。

除了在能耗、延迟和吞吐量方面的优势外,RPP 还因其小面积而脱颖而出。只有 119 平方毫米的芯片面积消耗使得 RPP-R8 成为面积受限的边缘计算的理想平台。RPP 的另一个特点是其高可编程性,由全面的端到端软件堆栈支持,可显著提高部署效率。与 CUDA 的兼容性使用户能够利用熟悉的 CUDA 生态系统,从而缩短学习曲线并促进更容易的采用。支持即时编程和图形编程模式,为用户提供了高度的灵活性,满足各种计算需求。包括 OpenRT 和 RPP-BLAS 在内的不同库支持也促进了各种场景中的高性能和高效部署。全栈解决方案,包括硬件架构和软件支持,使 RPP 在各种边缘计算硬件中脱颖而出。

六、RPP 架构得到国际学术权威认可

由芯动力携手英国帝国理工、剑桥大学、清华大学和中山大学等顶尖学府的计算机架构团队共同撰写的论文《Circular Reconfigurable Parallel Processor for Edge Computing》(RPP 芯片架构)已成功被第 51 届计算机体系结构国际研讨会(ISCA 2024)的 Industry Track 收录。芯动力创始人兼 CEO 李原博士与帝国理工博士毕业生 Hongxiang Fan(现在英国剑桥的三星 AI 中心做研究科学家)受邀在阿根廷布宜诺斯艾利斯举行的 ISCA 2024 会议上发表演讲,与 Intel 和 AMD 等国际知名企业的专家同台交流。

作为计算机体系结构领域的顶级学术盛会,ISCA 由 ACM SIGARCH 与 IEEE TCCA 联合举办。自 1973 年创办以来,一直是推动计算机系统结构领域进步的先锋力量,其广泛的影响力和卓越的贡献使其成为谷歌、英特尔、英伟达等行业巨头竞相展示前沿研究成果的高端平台。ISCA 与 MICRO、HPCA、ASPLOS 并称为四大顶级会议,而 ISCA 更是其中的佼佼者,论文录取率常年保持在 18% 左右。多年来,众多在 ISCA 上发表的研究成果已成为推动半导体和计算机行业发展的关键动力。

本次入选的可重构并行处理器(RPP)论文为边缘计算领域注入了强劲动力。实验结果充分证实,作为一款并行计算的硬件平台,RPP 的性能全面超越当前市场上的 GPU,特别是在对延迟、功耗和体积有着极高要求的应用场景中表现尤为出色。

六、结语

ChatGPT 引爆了 AI 大模型,从而带动了 GPU 和 AI 加速器的巨大需求。AI 应用的发展趋势将从云端 AI 训练和推理逐渐往边缘和端侧 AI 渗透,为各种 AI 应用提供软硬件支持的 AI 服务器也同样遵循从数据中心到边缘计算的分布式扩展趋势。传统 GPGPU 在边缘 AI 应用场景中开始暴露出明显的架构缺陷,其高成本、高功耗和高延迟问题迫使业界专家寻求更为高能效的并行计算架构。

在对比 CPU、GPU、ASIC、FPGA 和 NPU 等不同计算架构后,我们发现可重构计算架构 CGRA 是比较适合边缘 AI 应用的,尤其是芯动力提出的可重构并行处理器(RPP)。通过与英伟达同类 GPU 对比分析,基于 RPP 架构的 R8 芯片在延迟、功耗、面积成本、通用性和快速部署方面都表现出色,我们认为这是目前最理想的边缘 AI 并行计算架构。

在今年 7 月份阿根廷举行的 ISCA2024 学术会议上,关于 RPP 处理器架构的论文得到国际学术权威认可。随着边缘 AI 的发展,AI 服务器和 AI PC 将迎来快速增长的黄金时期,而支持这类边缘 AI 设备的 AI 加速器也将同步增长。由珠海芯动力科技提出的 RPP 处理器芯片也将得到业界认可,成为边缘 AI 应用场景中最为理想的 AI 加速处理器。


新型NeuRRAM芯片如何在低能耗下支持边缘设备的AI运算并保障数据隐私?

革新边缘智能:新型NeuRRAM神经形态芯片

科研先锋们成功研发出一款革命性的芯片——NeuRRAM,它在边缘计算领域的突破性表现令人瞩目。 这款芯片在内存中进行高效AI运算,能耗仅是传统平台的微乎其微,开启了全新的能源效率革命。 NeuRRAM的出现,使得图像识别和语音识别等复杂任务能在边缘设备上实时处理,实现本地化智能,同时保持与传统数字芯片相当的高精度。

NeuRRAM的创新之处在于其基于电阻式随机存取存储器的架构,它巧妙地解决了数据传输的瓶颈,赋予了边缘设备强大的处理能力和卓越的数据隐私保护。 Wan,这位内存计算技术领域的先驱,正引领这一创新成果向商业化迈进,他的目标是将实验室的创新带入现实生活中的各种应用场景。

NeuRRAM的架构设计独具匠心,CMOS神经元与RRAM紧密融合,形成了可灵活调整的并行计算矩阵。 这使得神经网络能够根据需要在不同数据流方向进行推理,且具备动态可重构性,为多核和模型并行推理提供了无限可能。

在国际研究团队的紧密合作下,加州大学圣地亚哥分校主导的项目,得到了斯坦福、清华大学和NotreDame等知名学府的鼎力支持。 研究人员不仅设计了高能效的电路,还开发出硬件算法,确保了AI计算的精准度,使其适用于广泛的神经网络模型。

Wan和其团队的卓越贡献在于,他们不仅打造了这款芯片,还构建了完整的工具链,包括芯片接口和AI应用的部署流程,为边缘智能的广泛应用奠定了坚实基础。

NeuRRAM的诞生,预示着边缘人工智能的未来将更加高效、灵活,一场智能化的革新风暴正在悄然酝酿。

关于计算机专业研究生研究方向

1、计算机应用技术研究方向:计算机网络、实时计算机应用、CIMS、计算机图形学、并行计算、网络信息安全、数据库、情感计算、数据挖掘、分布式计算、知识工程、计算机视觉、自动推理、机器学习、草图理解、网络性能分析与协议设计、网络管理与安全、计算机图形学、信息可视化、基于GPU的高性能计算、复杂系统(应急、物流、海洋)领域工程、基于SOA的空间信息共享与业务协同、语义搜索引擎、自然语言处理、机器翻译、搜索引擎、空中交通信息系统与控制、民航信息与决策支持系统、智能交通系统理论与技术等。 专业特点:计算机应用技术是针对社会与各种企事业单位的信息化需求,通过对计算机软硬件与网络技术的选择、应用和集成,对信息系统进行需求分析、规划和设计,提供与实施技术与解决方案,创建优化的信息系统,并对其运行实行有效的技术维护和管理的学科。 培养这方面人才所涉及的知识面包括:数学与信息技术基础、程序设计基础、系统平台技术、计算机网络、信息管理与安全、人机交互、集成程序开发、系统架构与集成、Web与数字媒体技术、工程实施、职业操守等。 培养目标是为企事业单位和政府机构提供首席信息官及承担信息化建设核心任务的人才,并提供为IT企业提供系统分析人才。 科研状况:本专业是天津市第一个计算机类博士点,主要从事计算机技术在其它领域应用中核心技术问题研究及相关信息系统开发。 近年来在计算机集成制造(CIMS)、计算机辅助教学、虚拟现实技术应用、计算机工业控制、电子商务等方向承担国家863项目及重大项目、国家自然科学基金十余项。 承担省部级及横向科研课题近百项。 为国家和天津市的信息化建设做出了重要贡献。 近几年报考简况:本专业从80年代初开始招生,至今已为国家培养出硕士学位研究生300多名。 近年来,报考人数和录取名额逐年同步增加。 硕士期间主要课程及论文要求:主要课程:高等计算机网络、计算理论、排队论及在计算机中的应用、应用组合数学、软件体系结构、面向对象方法学、分布式计算机系统、并行计算、高级计算机图形学、高级人工智能、模式识别与理解、机器学习、密码学与信息安全、统一建模语言。 论文要求:论文选题涉及计算机在各领域应用的理论研究、尖端技术开发、以及在国民经济各个领域的应用研究。 论文应能全面反映本学科发展动态、具有科学性、先进性和一定的创新性。 对于理论研究课题,要求达到较高的理论水平和创新;对于系统设计、系统开发及系统应用课题,要求指导理论正确,实现技术先进,设计新颖,所设计的系统应能付诸实现、具有实际应用价值并能够带来明显的社会经济效益。 就业方向:本专业培养的研究生具有坚实的计算机科学与技术的理论基础,全面掌握计算机应用领域的理论和工程方法,能很好地胜任高等院校、科研院所、大型企事业单位、高新技术产业等的教学、科研、系统设计、产品开发、应用系统集成等工作。 2、计算机软件与理论研究方向:计算理论、算法理论; 软件工程、中间件、智能软件、计算环境;并行计算、网格计算、普及计算;密码学、信息安全、数据理论;图形图象算法、可视化方法;人工智能应用基础;理论计算机科学其他方向。 专业特点:计算机软件与理论专业涉及计算机科学与技术的基本理论和方法,强调计算、算法、软件、设计等概念,主要的领域包括计算理论、算法与复杂性、程序设计语言、软件设计与理论、数据库系统、人工智能、操作系统与编译理论、信息安全理论与方法、图形学与可视化计算、以网络为中心的计算等。 科研状况:计算机软件与理论专业是我院重点发展,进步较快的专业。 近年来承担国家863、自然科学基金、,以及省部级项目多项。 在网络信息安全、中间件技术、并行计算、网格计算、计算机图形学等方面取得了多项前沿性成果。 近几年报考简况:本专业从96年代初开始招生,至今已为国家培养出硕士学位研究生50多名。 近年来,报考人数和录取名额逐年同步增加。 硕士期间主要课程及论文要求:主要课程:计算理论、应用组合数学、软件体系结构、面向对象方法学、分布式计算机系统、并行计算、高级计算机图形学、高级人工智能、模式识别与理解、机器学习、密码学与信息安全、统一建模语言。 论文要求:论文选题涉及计算机软件的理论研究、尖端技术开发、以及在国民经济各个领域的应用研究。 论文应能全面反映本学科发展动态、具有科学性、先进性和一定的创新性。 对于理论研究课题,要求达到较高的理论水平和创新;对于系统设计、系统开发及系统应用课题,要求指导理论正确,实现技术先进,设计新颖,所设计的系统应能付诸实现、具有实际应用价值并能够带来明显的社会经济效益。 就业方向:本专业培养的研究生具有坚实的计算机科学与技术的理论基础,全面掌握计算机软件的理论方法,以及软件工程、信息系统、并行计算、普及计算等等的软件系统开发技术,能很好地胜任高等院校、科研院所、大型企事业单位、高新技术产业等的教学、科研、系统设计、产品开发、应用系统集成等工作。 3、计算机系统结构研究方向:分布式计算机系统、计算机网络系统与全球个人计算系统、真实感图形生成与虚拟现实技术专业特点:计算机系统结构(原名计算机组织与系统结构)专业全面研究各种类型的计算机系统(从单机到网络)的构成、硬件与软件的联系与功能匹配、计算机系统性能评价与改进等。 该专业的研究课题涉及高性能处理机系统结构、多机系统、并行计算与分布式计算系统、计算机系统性能评价、VLSL设计、容错计算技术、计算机接口技术、计算机网络系统与通信系统、移动计算、全球个人计算系统等。 科研状况:本专业近年来承担多项国家科委、国家教委、国家计委及天津市自然科学基金项目,并有多项科研获奖。 其中G.T9112计算机解密系统获北京市公安局科技进步二等奖,表面高度复杂实体的CAM获国家科委科技进步二等奖。 目前承担国家自然科学基金项目“面向ASIC的真实感图形算法和系统结构的研究”、国家高科技863项目“用于建筑环境仿真设计的分布式多用户虚拟现实系统”、天津自然科学基金项目“分布式多用户VR开发系统平台的研究”和一大批为企事业单位开发的横向科研项目。 近几年报考简况:本专业从80年代初开始招生,至今已为国家培养出硕士学位研究生50多名。 近年来,报考人数和录取名额逐年同步增加。 硕士期间主要课程及论文要求:主要课程:应用数学、外语、高等计算机网络、排队论及在计算机中的应用、计算理论、现代计算机体系结构、计算机综合实验、计算机控制及应用、计算机网络研究热点问题、计算机系统仿真、量子计算、密码学与信息安全、面向对象方法学、嵌入式系统设计、统一建模语言、图象/模式识别与理解、机器学习、软件体系结构。 论文要求:论文选题涉及计算机系统结构的理论研究、尖端技术开发、以及在国民经济各个领域的应用研究。 论文应能全面反映本学科发展动态、具有科学性、先进性和一定的创新性。 对于理论研究课题,要求达到较高的理论水平和创新;对于系统设计、系统开发及系统应用课题,要求指导理论正确,实现技术先进,设计新颖,所设计的系统应能付诸实现、具有实际应用价值并能够带来明显的社会经济效益。 就业方向:本专业培养的研究生具有坚实的计算机科学与技术的理论基础,全面掌握计算机系统结构、计算机工程、网络工程、嵌入式系统等的应用开发技术、能很好地胜任高等院校、科研院所、大型企事业单位、高新技术产业等的教学、科研、系统设计、产品开发、应用系统集成等工作。 计算机系统结构 02 网络与信息安全04 计算机通信,信息安全,多媒体信号处理 05 图形图像处理技术07 计算机图形图像处理技术、嵌入式系统 09 计算机网络与图形图像处理 10 计算机网络与信息处理11 输入输出技术与设备、图像处理与图像理解 12 信息安全理论与技术,嵌入式系统13 网络安全14 信息安全与编码15 网络安全和网络计算 16 图形图像和外设17 计算机输入输出技术与设备、图形图像处理与理解 考试科目:①101政治理论②201英语③301数学(一)④431计算机基础(计算机基础包含离散数学45分;数据结构45分;计算机组成原理60分)计算机软件与理论 02 面向对象技术04 软件安全与编译器体系结构 06 分布计算与互联网技术08 并行与分布计算,生物信息学算法 09 软件工程、信息系统 10 软件理论与应用11 高可信软件技术、互联网计算与互联网软件、可编程芯片支持软件和嵌入式系统12 软件测试与自演化技术 14 程序理解、软件再工程15 计算智能的理论、方法与应用16 高可信软件技术、互联网计算与互联网软件、可编程芯片支持软件和嵌入式系统

美国计算机专业最好的是哪一间大学?

美国计算机专业最好的是:麻省理工学院(MassachusettsInstituteofTechnology)

麻省理工学院素以顶尖的工程学和计算机科学而著名,拥有麻省理工人工智能实验室(MITCSAIL)、林肯实验室(MITLincolnLab)和麻省理工学院媒体实验室(MITMediaLab),位列2016-17年世界大学学术排名(ARWU)工程学世界第一、计算机科学第二,2017-18年USNews全美研究生院排名工程学第一、计算机科学第一,与斯坦福大学、加州大学伯克利分校一同被称为工程科技界的学术领袖。

2017-18年度,麻省理工学院位列QS世界大学排名世界第一[15]、USNews世界大学排名世界第二、世界大学学术排名(ARWU)世界第四、泰晤士高等教育世界大学排名世界第五。 2018年6月,《泰晤士高等教育》公布世界大学声誉排名,麻省理工学院排名世界第二、仅次于哈佛大学。

//30adcbefb36a4e04ea9aecc7cd98d109d07target=_blanktitle=点击查看大图class=ikqb_img_alink>//30adcbefb36a4e04ea9aecc7cd98d109d07?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_600%2Ch_800%2Climit_1%2Fquality%2Cq_85%2Fformat%2Cf_autoesrc=扩展资料:

在美国计算机专业出麻省理工外排名靠前的大学:

1、斯坦福大学StanfordUniversity

位于加州帕洛阿尔托(PaloAlto,California),斯坦福大学的毕业生遍布了谷歌、惠普以及Snapchat等顶级技术公司。

斯坦福大学为硅谷(SiliconValley)的形成和崛起奠定了坚实的基础,培养了众多高科技公司的领导者,这其中就包括惠普、谷歌、雅虎、耐克、罗技、Snapchat、美国艺电公司、太阳微系统、NVIDIA、思科及LinkedIn等公司的创办人。

2、加州大学伯克利分校UniversityofCalifornia-Berkeley

位于加州伯克利(Berkeley,California),建于1868年,是美国的一所公立研究型大学,加州大学伯克利分校还是世界数学、自然科学、计算机科学和工程学最重要的研究中心之一,拥有世界排名第1的理科、世界第3的工科和世界第3的计算机科学,其人文社科也长期位列世界前5。 2015年11月,QS发布了全球高校毕业生就业力排名,加州大学伯克利分校排名第八。 据经济学家分析,一个在加州大学伯克利分校的工科学生和一个没读过大学的人相比,在大学毕业20年后,该校毕业生的总收入会比没上过大学的人多110万美元。

计算机专业毕业生最好去向:谷歌、甲骨文、苹果。

3、加州理工学院CaliforniaInstituteofTechnology

伯克利加州大学(UniversityofCalifornia,Berkeley),简称伯克利,位于美国旧金山湾区伯克利市,是世界著名公立研究型大学、在学术界享有盛誉,位列2016年ARWU世界大学学术排名世界第3、USNews世界大学排名世界第4。

4、佐治亚理工学院GeorgiaInstituteofTechnology

位于佐治亚州亚特兰大市(Atlanta,Georgia),是美国一所综合性公立大学,始建于1885年。 与麻省理工学院及加州理工学院并称为美国三大理工学院。 其中计算机科学专业全美排名第10,该校的电气与电子工程专业声誉不错。

佐治亚理工学院在全球有着顶尖的学术声誉,其代表学科是工程。 该校是美国最好的理工类大学之一。 GeorgiaTech下属的航空系统设计实验室(AerospaceSystemDesignLaboratory,简称ASDL)承担了美国政府的机密的重大科研项目。

  • 声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
  • 本文地址:https://m.srwj168.com.cn/caijing/14335.html
一加13将采用京东方2K四曲屏并有望配备超声波指纹 售价预计
二老仍稳 2将蜕变 辽宁热身大胜北京!大牙 李虎翼张陈治锋齐