January 31, 2025

传AMD Radeon 9070 XT 将比 RTX 5070 Ti 快近 15%

英伟达RTX 5080的首批测试数据显示,其游戏性能较RTX 4080 Super提升约16%。这一幅度虽未达到部分玩家对“换代升级”的预期,却为AMD的RDNA 4显卡创造了潜在的突破口。据业内爆料人Moore's Law is Dead透露,AMD正通过精准的定位策略,试图在性价比战场上撕开一道缺口。

根据泄露信息,Radeon RX 9070 XT在传统光栅化性能上预计领先RTX 5070 Ti约15%,与RTX 4080 Super持平;而RX 9070则对标RTX 5070,性能优势维持在12%左右。这种策略与AMD处理器市场的打法一脉相承——用次一级定价的产品,实现跨级性能对标。

在光线追踪领域,AMD仍需追赶。以《赛博朋克2077》4K光追场景为例,RX 9070 XT的帧率介于RTX 4070 Ti Super与RTX 3090 Ti之间,与当代英伟达旗舰仍有明显差距。硬件分析师指出:“RDNA 4的光追单元虽有改进,但架构效率仍落后英伟达一代以上。”

目前流出的定价策略显示,RX 9070 XT可能定价849美元,较传闻中的RTX 5070 Ti低约15%。若该价格最终坐实,AMD将延续“每美元性能比”的优势公式。参考历史数据,当两代显卡性能差距在15%-20%时,价格每降低10%,市场份额可提升5-7个百分点。

但英伟达的护城河依然坚固。DLSS 4的超分辨率技术已覆盖Steam平台32%的热门游戏,而FSR的兼容性仅为前者三分之一。更关键的是,DLSS 4或将引入实时场景重构功能,这可能进一步拉大两家的技术代差。

从台积电N4P工艺的流片数据来看,AMD正在工艺层面寻求突破。为提升RDNA 4的能效比,工程师将电压控制精度提升至0.8mV级别,这一标准通常用于移动芯片。但代价是初期良率仅67%,较英伟达GB202核心低13个百分点。若量产阶段良率无法突破75%,可能影响首发供货量。

而英伟达的反制措施更具针对性。RTX 50系列被曝采用动态频率调节技术,可根据负载需求自动提升5-8%的核心频率。该设计在应对竞品压力测试时尤为有效,相当于为性能保留弹性空间。

回顾近年显卡战争,AMD的性价比策略曾多次奏效:RDNA 2迫使RTX 3080官降100美元,RDNA 3则让RTX 4070 Ti提前三个月发布。但如今的市场环境已发生变化——随着光追游戏占比突破40%,DLSS/FSR技术差异直接影响用户体验。

行业调查显示,60%的玩家愿意为领先的光追性能多支付15%预算,而仅有28%用户会单纯因价格优势更换阵营。这意味着AMD若想真正撼动市场,不仅需要维持性能价格比,更需在FSR 4技术上实现跨越式升级。

RTX 5080的“温和升级”与RDNA 4的“精准卡位”,折射出显卡行业的技术迭代逻辑转变:绝对的性能霸权正在让位于细分场景的优势争夺。对于AMD而言,能否将制程红利转化为可持续的市场份额,不仅取决于实验室数据,更考验其对玩家真实需求的洞察——当4K光追成为新常态,性价比的定义正在被重新书写。

详解Linux内核模块的加载机制

1、内核模块

内核模块是什么?

Linux内核模块是动态加载到内核中的代码,可以在不重启系统的情况下扩展功能,比如设备驱动或者文件系统支持。这样用户不需要把所有功能都编译进内核,节省了资源,提高了灵活性。

模块的文件格式

Linux内核模块通常是.ko文件,也就是Kernel Object的缩写。这些文件是ELF格式的,但和用户空间的程序不同,它们包含的是特定于内核的信息。比如,模块的元数据,像作者、许可证、描述等,这 些信息保存在.modinfo段里。还有.init.text和.exit.text这样的段,分别对应模块初始化和退出时的代码。这些段在模块加载和卸载时会被执行。

模块的加载过程

用户通常使用insmod或modprobe命令来加载模块。insmod是直接加载,而modprobe会处理依赖关系。

January 30, 2025

A Script to Automate Git Add, Commit & Push

I wanted a way to automate the git add, commit & push commands. Here's how I did it...

Since learning how to use Git, it has become an integral part of my workflow for things like publishing to this site, and updating my various projects, like Simple.css and That Watch Bloke. However, pushing changes to a Git repository can get tedious, as it involves 3 commands. Every. Single. Time:


git add *
git commit -m "Your commit message..."
git push

I use VSCodium to write code, which integrates with Git, making things easier. But I still wanted a way to automate the process of committing to my Git repositories without having to enter those 3 commands, over and over again.

Plus, if I'm writing a post (like this very one), I'm not in VSCodium. I'm typing the post in Typora; so being able to flip to the command line and enter a single command, would be great.

BASH script

Since I use an M1 Macbook Air, which is basically Unix under the hood, I can use good old BASH to do this. So I used the following script (thanks to StackOverflow):


#!/bin/bash
read -p "Commit message: " desc
git add . && \
git commit -m "$desc" && \
git push

I then added the following line to my .zshrc file so I can call this script with a single command:


alias push=~/path/to/git-push.sh
Note

If running the script fails with permission issues, run chmod +x git-push.sh to give the script execution rights.

So now, whenever I'm in a Git repo within my command line, all I need to do is type the command push. My script will then be called, it will ask for a commit message, then push to the repo. All automatically.

January 12, 2025

嵌入式系统领军者:风河公司成长史

不同于个人电脑的Windows操作系统,我们在日常生活中使用的程序并无特别的优先级。而在军事国防、 航空航天等领域,设备对系统的响应时间有更加苛刻的要求,这就需要使用实时操作系统(Embedded Real-time Operation System)。

VxWorks是由风河系统公司(Wind River System.Inc,以下简称风河公司)于1983年开发设计的嵌入式实时操作系统,也是目前为止应用最广的嵌入式实时操作系统之一。美国 F-16、FA-18 战斗机、B-2 隐形轰炸机和爱国者导弹,甚至连1997年4月在火星表面登陆的火星探测器,都使用了风河VxWorks操作系统。

随着5G时代的到来,嵌入式系统的迎来了高速发展的新机会。无论是工业生产、智能穿戴、智能医疗、智能家庭安防的数据使用效率会更高,所以,作为嵌入式系统的研发鼻祖,风河公司是如何发展起来的呢?

作者 | 阿法兔

公司简介

风河系统公司(Wind River System Inc)于1981年在美国洛杉矶成立,因研发实时操作系统VxWorks而闻名,也是嵌入式系统和边缘计算操作系统的服务提供商,主要客户遍布国防、航天(NASA等)、汽车、工业控制、医疗等。

1993年,风河系统公司在纳斯达克上市,2009年,风河公司被英特尔收购。2018年,知名私募公司TPG从Intel收购了风河公司。

产品和商业模式

目前,风河系统公司的产品主要包括五大类:

  • VxWorks嵌入式实时操作系统
  • 风河(嵌入式)Linux
  • BSPs 板级支持包(BSP)(Board Support Package)是介于主板硬件和操作系统中驱动层程序之间的一层,一般认为它属于操作系统一部分,主要用于支持操作系统,并为上层驱动程序提供访问硬件设备寄存器的函数包,使它能够更好的运行于硬件主板。
  • 虚拟化(服务):风河Titanium Cloud运营商级虚拟化解决方案(主要服务对象为运营商等电信网络)/风河Helix虚拟化平台
  • 风河SIMICS:系统模拟工具等

风河的发展之路

风河公司的故事要追溯到40多年前。

1974年,创始人Jerry Fiddler在UIUC(伊利诺伊大学厄巴纳-香槟分校)完成了他的音乐学位,之后又读了计算机硕士,但在毕业后,并没有在伊利诺伊找到心仪工作。

于是,1977年,Jerry Fiddler奔赴加州,进入加州大学劳伦斯伯克利实验室(The University of California's Lawrence Berkeley Laboratory)工作。

期间,Jerry Fiddler在实验室编写了可以控制大型系统的计算机嵌入式软件,并开始研究可以实时运行的系统(平时使用的个人PC多是非实时操作系统),这段经历,为后面创建风河公司奠定了基础。

1981年,因为放不下心中的音乐梦,Jerry Fiddler辞掉了实验室的工作,准备继续做音乐。为了维持生计,Jerry开始了一项业务——提供商业化的实时软件咨询服务。早期客户包括国家橄榄球联盟、导演Francis Ford Coppola(执导经典电影《教父》)等。

同年,Fiddler休假期间,邀请伯克利的前同事David Wilner来帮忙,Wilner被Fiddler的公司业务所深深吸引,于是,在Fiddler度假回来后,二人一拍即合,成立了名为Wind River Systems的合伙公司(公司命名源于Fiddler度假的怀俄明州风河Wind River山脉)。

1983年,风河公司正式注册成立。Fiddler和David每人出了3000美元和一张办公桌,开始了创业之旅,二人以掷硬币的方式决定谁当CEO,Fiddler赢了。

1987年:启程软件制造之路

公司成立后,风河公司继续专注于实时软件技术咨询业务。1987年,对于风河是一个重大战略转折点,因为正是在这一年,风河开始研发独立的自有品牌软件。

早在20世纪80年代,风河管理层就判断"未来的计算将不是发生在台式电脑上,而是发生在日常生活中的无数电器中",而当时嵌入式还是一个极为新兴的领域。

“Future computing would take place not on a desktop PC, but inside the myriad appliances of everyday life.”

对未来趋势的正确判断,是公司能够长远发展的重要因素。本着这样的信念,风河首款独立研发的嵌入式实时操作系统VxWorks在1987年面世。

当时的风河管理层认为:未来越来越多的产品需要嵌入式微处理器,日常电器会不断趋向智能化,这些电器需要系统计算能力,就如同PC个人电脑需要微芯片一样,嵌入式微处理器也需要属于它的操作系统。然而,与PC的微处理器不同,嵌入式处理器通常只执行单项任务(例如:满足某些特定条件时,激活汽车的防抱死刹车系统或者调节冰箱温度等)

时间和反应速度是嵌入式技术中最重要的因素。

如果一个操作系统启动汽车的防抱死刹车功能,该操作系统必须能够在微秒内管理和编排无数的进程,也就是说,它必须 "实时 "工作,不能有延迟或滞后的时间。

风河公司的VxWorks是首个可以为在很多产品上兼容的实时操作系统。VxWorks出现之后,设备制造商不再需要为每个特定的产品再单独定制一个嵌入式操作系统。

这种便捷性让VxWorks在行业内迅速普及。

由此,风河公司销售额一路飙升,从1991年的802万美元上升到1992年的1709万美元。

在大趋势发展的时代背景下,科技公司的技术互补,常常会推动新的产业进步。

1993年,风河为摩托罗拉公司的高性能微处理器单元设计了软件,而摩托罗拉在人类无线通信领域的发展中发挥了巨大作用。

1993年4月,风河公司在美国上市,融资1500万美元。同年,风河公司推出系统分析工具WindView,用于开发监测嵌入式软件和应用程序动态。

90年代中期:在波折中前行

成功上市后的风河公司并没有一帆风顺。由于经营管理模式问题,风河公司陷入低潮。

1993年,Fiddler的高级顾问David St. Charles离开风河,转而加入风河的老对家Integrated Systems 公司。

1994年,风河公司的股票跌到了历史最低点,销售额没有突破,利润骤降。

创始人Jerry Fiddlery意识到,风河需要商业经验更丰富的掌舵者才能恢复元气,当年3月,Jerry Fiddler辞去了CEO的职务,任命前Vantage分析系统公司的CEO Ronald Abelmann加入风河,成为风河公司的新一代CEO。

新官上任三把火,Ronald Abelmann迅速重组商业模式,精简人员,并大力拓展欧洲和日本市场。而老创始人Jerry Fiddler则继续专注于软件研发设计。

在Fiddler的技术领导下,1995年,风河推出了Tornado开发工具包。Tornado包括VxWorks的更新版本,以及一整套在微软和Unix环境下运行的工具。Tornado最大的优势在于灵活性,可以与自制或第三方工具集成。

1995年是风河公司发展最强劲的年度之一,Tornado开发工具包在1995年获得了《电子设计新闻》的 "年度嵌入式开发软件创新奖",当年公司收入飙升至3210万美元。

1996年,风河公司进行了二次增发,融资5000万美元,用于战略收购以及研发,并开始对初创科技企业进行投资,目的是将生产嵌入式微处理器的初创公司培养成风河的长期客户和合作伙伴。

1997年,VxWorks被选为美国宇航局NASA的Pathfinder(探路者)的操作系统,在美国宇航局的明星带动效应下,风河当年的销售额飙升到6400万美元新高,净利润(Net income)达1130万美元。

1998年,嵌入式市场增速进一步加快,风河公司的市场占有率也逐步上升,每卖出的10个微处理器,就有9个是用于生产嵌入式产品。

当年《旧金山纪事报》报道:嵌入式系统市场的增速比PC市场要快得多,是科技公司的下一个机会来临点。

20世纪90年代末期,Jerry Fiddler就提到:"微处理器渗透了我们的生活,整个世界正在向嵌入式发展。处理器在墙壁中,在汽车里,它们不仅应用于计算机中,还会在我们的基础设施上发挥越来越重要的作用,未来更会全面应用于我们的交通、通信、能源医疗等系统。

IDC分析师曾预测,在1998年至2003年期间,嵌入式系统市场将增长76%(CAGAR),在2003年达到79亿美元。

当时(2000年前后)的技术专家也认为,未来将出现一个 "后PC "时代,消费者将不再购买笨重、昂贵的PC,转而会购买一系列专业工具来完成特定任务,例如,可以上网的 "智能 "手机,或是可以自动在食物不足时订购生鲜产品的智能冰箱。

2020年的今天来看,历史的确在朝着这样的方向发展。

当时,有两个因素推动了嵌入式系统市场的增长:

首先,计算机芯片的功能越来越强大,价格越来越便宜,导致芯片的普及率进一步上升。

其次,2000年前后互联网蓬勃发展,带来了大量的新机会。1999年7月,Jerry Fiddler在一篇专栏中宣称:"目前,风河触达的只是产品和电器的表层,而未来,这些产品和电器一定会和互联网连接起来"。消费者会越来越依赖数码相机和录音机、机顶盒以及它们与互联网的通信,这是未来人们生活必不可少的一部分。”

“我们正在进入一个新的世界,在这个世界里,互联网将不再只是连接电脑,而是以各种不同的方式连接人和事物。不仅是台式机上,我们的厨房、客厅、汽车和卧室,万物将会互联”

—Jerry Fiddler

这是2000年Jerry Fiddler对物联网的预言,2020年的今天,我们回望当年,他的预测基本都被今天的现实生活所验证。

竞争对手

并不止风河一家公司发现嵌入式系统的潜力。

在欧洲,1998年,诺基亚(欧洲)、Psion PLC(英国)和爱立信(Telefonaktiebolaget Ericsson LM)成立塞班公司,设计了EPOC操作系统,主要用于手机和无线设备。

在美国,风河公司最直接的竞对是Integrated Systems Inc,他们开发的pSOS嵌入式操作系统有一批忠实用户。而像微软公司这样的巨头,也想利用其PC操作系统领域的优势,进军嵌入式系统市场。

1998年4月,微软宣布对嵌入式操作系统Windows CE进行功能升级,Windows CE与微软的Windows系统具有兼容性(用户能够在嵌入式产品和PC之间轻松地传输数据)。

尽管微软进入嵌入式系统市场获得了市场关注,但在风河创始人Jerry Fiddler并不担心,因为整个嵌入式系统市场相对分散,风河公司拥有35%的市场份额,在电梯、汽车工业等领域仍有着传统巨头难以匹敌的优势。

20世纪90年代后期:挑战与美好前景

1998年,风河开始了系列战略收购。首先是收购Network Computer Inc和Zinc Software的系列专利,接着开始进军互联网嵌入式设备市场。

在购买了Xact公司的交换技术后,风河公司收购了便携式源代码供应商RouterWare。RouterWare提升了风河研发数据通信和电信设备软件的能力。1999年,风河推出了开发平台--Tornado II。

伟大的公司总会历经种种困难,1999年4月,时任CEO Abelmann因和创始人的理念不同,而选择辞职。Abelmann离开后,Jerry Fiddler再次扛起了CEO的重任。

Jerry定下了新一轮目标:2004年前,公司营目标是10亿美元,并且,他重新调整了公司架构。调整后的公司架构主要分为5大业务部门:

  • 平台工程(Platform Engineering)
  • 消费者(Consumer)
  • 网络(Networks)
  • 服务(Services)
  • 运输/国防/工业(Transportation/Defense/Industrial)

1999年9月,风河聘请了半导体Applied Materials的高管Tom St.Dennis担任新CEO。

2000年,风河公司将老对手Integrated Systems及其子公司(包括Doctor Design、DIAB-SDS和TakeFive)收购。收购后,Jerry Fiddler继续担任董事长,而Integrated Systems的创始人Narend Gupta被任命为风河公司的副董事长。之后,风河又收购了Embedded Support Tools,该公司为嵌入式系统的编程、测试和调试提供硬件和软件工具。

2000年,风河发展顺风顺水,客户遍布美国工业界:安捷伦科技(Agilent Technologies, Inc)、洛克希德马丁公司(Lockheed-Martin Corp)、摩托罗拉和索尼等知名巨头都是风河的客户。同年6月,风河成立了2500万美元的风险投资基金(Wind River Ventures),目的是通过投资产品和技术背后的早期创新者,为行业增长持续赋能。

2000年,风河公司收购了Berkeley Software Design版本的Unix版本,旨在拓展除了商业软件之外的开源领域。

注:BSD UNIX是另一使用较为广泛的UNIX版本是美国加州大学贝克利分校开发的BSD UNIX,该版本大量安装在SUN工作站上。1993年推出了4.4BSD版本。BSD是网络的主要平台,对DARPA的TCP/IP提供了支持,其中的网络文件系统(NFS)提供了与很多计算机机种的连接,NFS及AT&T开发的远程文件共享(RFS)使UNIX系统在网络支持方面保持领先地位

但风河公司收购BSDi不仅仅因为它的开源性质,更是为了要应对Linux时代的到来。当时微软首席执行官Steve Ballmer曾称,Linux是微软的第一大威胁。

虽然Linux是从服务器开始的,但Red Hat、MontaVista Software和Lineo等公司一直致力于Linux推向嵌入式市场。而LynuxWorks的前身是Lynx Real-Time Systems,它也是风河公司的老牌竞争对手之一。

向Linux进军

2003年10月3日,风河正式宣布向嵌入式Linux方向发力。同时,将开源作为公司发展的主要方向之一。下一代的IDE (Wind River Workbench)将结合Eclipse(一个开源的技术工具框架),使公司能够将更多开发资源用于新技术。

并且,风河开始将现有产品和服务套件作为对Linux操作系统和VxWorks的补充,加大服务扩展到支持客户构建基于Linux的设备,同Red Hat合作开发包含Red Hat Linux操作系统的平台。

接着,风河加入了Linux联盟开放源码开发实验室和论坛,以进一步拓展公司在Linux生态中的业务。

2006年3月,2006年3月风河公司以2000万美元的价格,收购了瑞典的Interpeak AB公司。Interpeak是研发网络、安全和移动中间件的公司,此次收购的目的是为风河的设备软件平台提供互补的、高质量网络安全技术,加强了公司为设备制造商提供更高的平台扩展性和扩大的安全和关键任务认证支持的能力。

正如时任风河公司CEO Ken Klein所说, "Wind River和Interpeak是DSO公司,"随着联网设备的爆炸性增长,设备制造商将需要一个高质量、安全的网络协议栈,该协议栈可以在我们的RTOS和基于Linux的平台上普遍运行。Interpeak的安全、可认证的网络专业技术将增强Wind River的DSO战略,提供标准化的设备软件开发方法,为客户构建任何类型的连接设备提供选择和灵活性。"

2008年,在进入Linux市场五六年之后,借着风河VxWorks的技术实力、销售渠道和品牌等优势,风河逐渐成为最大的嵌入式Linux厂商。嵌入式Linux+VxWorks满足了多层次的电信、军工、工业自动化、医疗电子、消费类电子应用,并使风河进入了广阔的手机市场。

Intel收购风河

2009年6月,风河公司被英特尔(Intel)以8.84亿美元的金额收购。Intel收购风河是为了进一步拓展除PC和服务器以外的业务。

Intel以CPU扬名天下,而风河擅长嵌入式实时操作系统(RTOS)。Intel因无处不在的PC使用自己品牌的CPU而名扬天下,而风河崛起于航天军工电信汽车。

Intel编织出了摩尔定律和钟摆定律,风河在2004年攒出了DSO生态环境,看起来毫不相配,然而,同样看重嵌入式路线和多核路线是两家公司的共性。

在本次收购之前,风河和Intel早有合作。

Intel旗下的MID和车载娱乐组织当中,风河是Atom(凌动)芯片的合作伙伴。在这个阶段,Intel将发展嵌入式等后PC时代产品视为重要的发展方向。当时,Intel CEO欧德宁把嵌入式系统作为其第四大发展领域(下图)。其他三个分别是消费电子产品、移动互联网终端领域、上网本。

表面上看,Intel是将风河纳入软件与服务事业部旗下,但它的真正目标是将触角伸向比PC、服务器更大的市场领域,所有的电子与高科技设备,都可能成为该公司的处理器与嵌入式解决方案的可能对象,包括消费电子、移动互联网终端以及嵌入式系统领域,涉及智能手机、MID、车用娱乐装置、网络设备、航天军事、电信、能源等。

Intel希望在这个比PC更大、规模可达数十亿美元的市场扮演重要角色。为了实现Intel的市场目标,Intel需要嵌入式软件厂商的支持。目前比较大的嵌入式OS厂商有微软、风河等。

由于ARM阵营的兴起,使Intel在微软心中的王者地位渐渐消失。而风河的各类产品完全可以满足嵌入式产品实时、高可靠性的需求。

Intel:为多核铺平道路

Intel五六年前发布了多核,多核最大的挑战是编程,可以说Intel把性能继续提高的难题推给了软件业,并且鼓励软件从业者“目前所有的软件编程人员都站在了同一起跑线上,都有可能成为新的微软。但是多核的编程挑战难以在短时间解决。而风河较擅长多核编程,因为嵌入式世界比CPU领域进入多核要早十多年,拥有从同构核到异构核,从几核到十几核、几十核等实战经验。

并且,风河的业务同英特尔在手持设备、嵌入式和消费电子领域的发展方向基本一致。

起初,风河的老客户会有担心,认为风河不再独立,听命于英特尔,而后续无法为客户和合作伙伴提供良好服务。然而,被Intel收购后,风河公司却越发展越好,超出了以往的业绩,Intel收购风河获得了良好的协同效应,也促进了风河公司的发展。

2009年,在被Intel收购之后,风河成为GENIVI联盟的创始成员,开始向车联网以及车内系统研发方向进军(GENIVI旨在塑造开源车载信息娱乐系统(IVI)和网联汽车的未来)2011 年,风河和Magneti Marelli为汽车行业创建了首个符合GENIVI标准的IVI解决方案。

2012 年,风河推出了物联网软件开发环境——风河Intelligent Device Platform。2014 年,为了适应物联网时代的开发需求,风河将VxWorks进行了改进,Intel推出了一系列搭载风河软件的物联网平台。

2014 年,风河推出Edge Management System(就是前面提到的风河Helix Device Cloud),是一款可将设备连接到云的软件平台。风河Helix是支持物联网产品和服务的产品集,通过新增的安全云连接功能扩展其产品。两年后,风河推出风河Helix Chassis汽车行业产品,包括风河Helix Cockpit和风河Helix Drive

截至2016年,VxWorks 653已被200多家企业客户应用于超过80架航空飞机的400多个项目中,是最受市场欢迎的嵌入式实时系统之一。

2017年,风河推出用于工业物联网的Titanium Control平台。

TPG Capital收购风河

2018年,因为业务发展方向的需求,英特尔公司将风河出售给私募公司TPG Capital LP。TPG合伙人Nehal Raj认为,物联网(IoT)、智能设备和边缘计算的融合发展,会给工业软件带来巨大的市场机会,这样的模式下,风河的发展会更加独立。而风河仍会是Intel重要战略合作伙伴。

今天的风河

现在,风河致力于边缘计算操作系统市场。随着各行各业越来越多地采用云原生架构和应用,再加上大量数据和信息不断地流动于网络边缘,嵌入式系统和设备的作用将变得越来越重要。

“单次部署不需要维护(Deploy Once and Leave Alone)”的模式已经不再适用于数字化世界—这个世界的运行基础在于网络边缘,应用需要具备高度适应能力,并且必须随着实际情况而调整。”

技术企业和科技创新,带来公司之间的相互赋能,又推动时代浪潮滚滚向前。

2021年,风河公司已走过40年,从一个种子,逐渐成长为参天大树,它的故事有很多借鉴意义:我们该如何看待技术路线变化,技术出身的CEO在管理公司时会遇到哪些可能的困难,以及,不同科技公司该如何取长补短,彼此支持,共同前进。

“莫道桑榆晚,为霞尚满天”

文章最后,就用Jerry Fiddler 2009年来中国旅行时拍的摄影作品作为结尾吧。

*本文特别感谢:老汪、谢谢谢睿

参考文献:

1.Intel收购风河的战略意义 wangying ,EEPW电子产品世界

2.Cole, Bernard, 'Change Is Music to His Ears,' Electronic Engineering Times, December 28, 1998.

3.Fiddler, Jerry, 'Smart Solutions for Post-PC,' Electronic Engineering Times, July 5, 1999.

4.Fost, Dan, 'Taking On Microsoft,' San Francisco Chronicle, November 3, 1998.

5.Fuller, Brian, 'Wind River Sinks pSOS as ISI Takeover Plays Out,' Electronic Engineering Times, March 6, 2000.

6.Quinlan, Tom, 'Alameda, Calif.-Based Firm's Operating System Has the Right Connections,' San Jose Mercury News, September 20, 1999.

7.Stubbs, Christina, 'Wind River Goes on the Defensive Against Microsoft,' Red Herring, August 1, 1999.

8.Turner, Nick, 'Software for Sophisticated Chips,' Investor's Business Daily, January 2, 1996.

9.‘Wind River Systems Acquires RouterWare, Inc.,' EDGE, July 5, 1999.

10.International Directory of Company Histories, Vol. 37. St. James Press, 2001.

11.CSDN:Intel收购风河,为Embedded Processor铺路,Freescale如何应对?kevin881 2009-06-06 15:13:00

12.https://newsroom.intel.com/editorials/intels-wind-river-acquisition-a-lesson-in-independence/#gs.qicrue

13.风河WIND River官网

海力士16层HBM3E原型及多种AI存储技术将亮相

韩国内存巨头 SK 海力士曾于 2024 年 9 月下旬宣布,已开始量产全球首款 12GB 的 36 层 HBM3E。近期,其16 层产品开发也有了进展。

根据其新闻稿,SK 海力士将于 1 月 7 日至 10 日在拉斯维加斯举行的 CES 2025 上展示其 16 层 HBM3E 原型。据SK海力士称,包括首席执行官兼总裁郭诺贞、人工智能基础设施总裁金柱善和首席开发官安贤在内的高管将出席此次活动。

SK 海力士称,它利用先进的 MR-MUF 工艺实现了领先的 16 层配置,有效减少了芯片翘曲并优化了散热。与 12 层 HBM3E 相比,16 层 HBM3E 产品可以将 AI 学习性能和推理性能分别提高 18% 和 32%。

ETNews 之前的一份报告显示,SK 海力士的 16 层 HBM3E 正在进行生产测试,目标是在 2025 年上半年供货。Sedaily 的另一篇报道援引首席执行官郭诺贞的话指出,SK 海力士计划在 2025 年下半年开始量产 HBM4。

在CES 2025 上,除了备受期待的 16 层 HBM3E 样品外,SK 海力士还将展示各种 AI 存储器产品,包括高带宽存储器 (HBM) 和 eSSD,以及为设备端 AI 和下一代 AI 存储器量身定制的解决方案。具体包括:企业级的122TB D5-P5336 SSD,由其子公司 Solidigm 于去年 11 月开发;Compute Express Link(CXL)和内存中处理(PIM),以及CMM-Ax和AiMX等模块化解决方案,CMM-Ax 通过增加计算能力增强了 CXL 的大容量内存扩展,从而提高了下一代服务器平台的性能和能效。

January 6, 2025

硬件加速简介

一、硬件加速的基本概念

什么是硬件加速

硬件加速是指在专用电路上实现某些计算或控制功能,从而在速度、功耗或吞吐量方面优于仅用通用 CPU 运行软件的方案。可以把它想象成“专用工具”:通用 CPU 像一个多功能瑞士军刀,几乎什么都能做,但是效率不一定最高;而硬件加速器则像为某项任务专门打造的刀具,能发挥更高的性能和更低的能耗。

为什么需要硬件加速

当系统中某个计算任务特别繁重或对实时性要求极高时,CPU 往往难以满足性能、功耗或延迟的需求。这时就需要通过在集成电路中专门设计一块加速模块来快速完成工作,从而减轻 CPU 的负担,让系统整体运行更有效率。

二、硬件加速的主要优势与代价

性能和能效提升

  • 性能提升:专门定制的电路可以最大程度地减少指令解释、数据搬运等开销,使核心计算部分获得更高的速度。
  • 能耗更低:因为电路只执行特定功能,不会像通用 CPU 那样加载各种通用逻辑,往往能在更低功耗下完成同等或更高的计算。

并行处理和带宽利用率

  • 更高的并行度:设计硬件加速器时,可以针对算法特点实现流水线或并行架构,一次处理更多数据。
  • 更好地利用带宽:与 CPU 不同,加速器可直接连接到高速存储或外围接口,更高效地使用存储和总线资源。

集成电路面积与灵活性的平衡

  • 面积利用率高:专用功能意味着更紧凑、更少的冗余逻辑。
  • 可灵活性受限:一旦电路被蚀刻到晶圆上,就很难进行后期修改或扩展功能。如果在量产后发现逻辑需要大幅变动,代价就很高。

开发与上市周期

  • 功能验证复杂:在硬件层面进行更改需要重新进行流程复杂的验证测试,故加速器的研发周期往往比软件更长。
  • 升级与维护难度:软件可以轻松地在线更新,而硬件加速器要想更新逻辑只能在设计阶段或通过部分可重构器件(如 FPGA)来实现,后期维护成本相对较高。

三、硬件加速的典型实现形态

可以用“盖房子”的比喻来说明:CPU 好比是通用的房间,能干很多事但不一定做得高效;硬件加速就像给房子单独加建一个专业车间或工具库,只干特定的活儿却效率极高。以下是常见的三类加速方式:

算法加速

  • 聚焦于核心算法本身,把系统中最耗时或对性能要求最苛刻的那部分逻辑硬件化。
  • 与软件配合:软件负责控制数据的输入输出和加速器调用流程,硬件模块专注于计算本身。

任务卸载

  • 把系统中的某个完整功能或工作单元“打包”交给专用硬件去处理,就像把一份外包工作交给专业团队。
  • 有时只卸载数据面(如大批量数据转发、加解密),将控制面仍放在 CPU。

异构计算

  • 不同类型的处理器(CPU、DSP、GPU、NPU、专用 ASIC 等)同处于一个平台中,各尽其能,互相配合。
  • 软件与硬件协同:需要对应用层程序进行分割、调度,并为不同硬件准备合适的指令或编程接口。

四、硬件加速常见应用领域

机器学习

  • 深度学习推理模块(如 NPU、TPU 等),在大规模并行计算和矩阵运算上大大优于通用 CPU。
  • 训练过程中 GPU/ASIC 加速也非常普遍。

视频/图像处理

  • 视频编解码、图像识别等需要持续处理海量数据的场景。
  • 各种移动端和智能摄像头里通常会嵌有专用加速器,用于实时编码、滤波和增强。

数据安全与网络

  • 硬件加密解密、数据压缩解压等功能往往采用专用加速器提高吞吐量。
  • 大规模数据中心使用专用网络处理器来应对高速数据包转发。

高性能计算(HPC)

  • 超级计算机、基因测序、气象预测等都需要极高的并行计算能力。
  • 利用 FPGA、GPU 或定制 ASIC 模块与 CPU 协同工作,获得更优的性能与能效比。

五、选择硬件加速时需考虑的关键因素

算法稳定性与适用性

  • 如果算法仍在快速迭代,硬件固化后难以调整。适合相对成熟和稳定的算法场景。

成本与产量

  • 一次性研发投入(NRE)和后期量产成本之间的平衡;如果需求量大、产品生命周期长,可以分摊定制 ASIC 的成本。

可升级性

  • 对于需要频繁升级的场景,可以考虑 FPGA 或在 SoC 中预留可重构逻辑。

研发周期与市场窗口

  • 软件可以快速迭代,而硬件定制通常耗时较长。如果上市时间紧迫,可先用 FPGA 验证或直接用通用 GPU 等加速方案过渡。

六、总结

硬件加速就好比在一支研发团队里增加了“专业特种兵”:专门针对某些关键任务实行高效率、低功耗的处理。它在性能、能效和带宽利用上具有巨大优势,但代价是灵活度和开发周期都可能面临更高的门槛。工程上要充分权衡算法成熟度、产品生命周期以及市场需求,来判断是否以及何时采用硬件加速方案。

January 4, 2025

串口,USB,CAN等协议总线介绍

在单片机开发中,UART、I2C、RS485等普遍在用,对它们的认识可能模棱两可,本文把它们整理了一下。

UART通用异步收发器

UART口指的是一种物理接口形式(硬件)。

UART是异步,全双工串口总线。它比同步串口复杂很多。有两根线,一根TXD用于发送,一根RXD用于接收。推荐文章:STM32与51单片机串口通信实例。UART的串行数据传输不需要使用时钟信号来同步传输,而是依赖于发送设备和接收设备之间预定义的配置。

对于发送设备和接收设备来说,两者的串行通信配置应该设置为完全相同。

起始位:表示数据传输的开始,电平逻辑为“0” 。

数据位:可能值有5、6、7、8、9,表示传输这几个bit 位数据。一般取值为8,因为一个ASCII 字符值为8 位。

奇偶校验位:用于接收方对接收到的数据进行校验,校验“1” 的位数为偶数(偶校验) 或奇数(奇校验),以此来校验数据传送的正确性,使用时不需要此位也可以。

停止位:表示一帧数据的结束。电平逻辑为“1”。

如果用通用IO口模拟UART总线,则需一个输入口,一个输出口。

I2C总线

I2C总线是一种同步、半双工双向的两线式串口总线。它由两条总线组成:串行时钟线SCL和串行数据线SDA。

SCL线——负责产生同步时钟脉冲。

SDA线——负责在设备间传输串行数据。

该总线可以将多个I2C设备连接到该系统上。连接到I2C总线上的设备既可以用作主设备,也可以用作从设备。

主设备负责控制通信,通过对数据传输进行初始化,来发送数据并产生所需的同步时钟脉冲。从设备则是等待来自主设备的命令,并响应命令接收。

主设备和从设备都可以作为发送设备或接收设备。无论主设备是作为发送设备还是接收设备,同步时钟信号都只能由主设备产生。

如果用通用IO口模拟I2C总线,并实现双向传输,则需一个输入输出口(SDA),另外还需一个输出口(SCL)。

SPI串行外设接口

SPI总线是同步、全双工双向的4线式串行接口总线。它是由“单个主设备+多个从设备”构成的系统。

在系统中,只要任意时刻只有一个主设备是处于激活状态的,就可以存在多个SPI主设备。常运用于AD转换器、EEPROM、FLASH、实时时钟、数字信号处理器和数字信号解码器之间实现通信。

为了实现通信,SPI共有4条信号线,分别是:

  • 主设备出、从设备入(Master Out Slave In,MOSI):由主设备向从设备传输数据的信号线,也称为从设备输入(Slave Input/Slave Data In,SI/SDI)。
  • 主设备入、从设备出(Master In Slave Out,MISO):由从设备向主设备传输数据的信号线,也称为从设备输出(Slave Output/Slave Data Out,SO/SDO)。
  • 串行时钟(Serial Clock,SCLK):传输时钟信号的信号线。
  • 从设备选择(Slave Select,SS):用于选择从设备的信号线,低电平有效。

SPI 的工作时序模式由CPOL(Clock Polarity,时钟极性)和CPHA(Clock Phase,时钟相位)之间的相位关系决定,CPOL 表示时钟信号的初始电平的状态,CPOL 为0 表示时钟信号初始状态为低电平,为1 表示时钟信号的初始电平是高电平。CPHA 表示在哪个时钟沿采样数据,CPHA 为0 表示在首个时钟变化沿采样数据,而CPHA 为1 则表示在第二个时钟变化沿采样数据。

UART、SPI、I2C比较

  • I2C线更少,比UART、SPI更为强大,但是技术上也更加麻烦些,因为I2C需要有双向IO的支持,而且使用上拉电阻,抗干扰能力较弱,一般用于同一板卡上芯片之间的通信,较少用于远距离通信。
  • SPI实现要简单一些,UART需要固定的波特率,就是说两位数据的间隔要相等,而SPI则无所谓,因为它是有时钟的协议。
  • I2C的速度比SPI慢一点,协议比SPI复杂一点,但是连线也比标准的SPI要少。
  • UART一帧可以传5/6/7/8位,I2C必须是8位。I2C和SPI都从最高位开始传。
  • SPI用片选信号选择从机,I2C用地址选择从机。

RS232串口通信

传输线有两根,地线一根。电平是负逻辑:

-3V~-15V逻辑“1”,+3V~+15V逻辑“0”。

RS 232串口通信传输距离15米左右。可做到双向传输,全双工通讯,传输速率低20kbps。

下图是DB9公头和母头的定义,一般用的最多的是RXD、TXD、GND三个信号。

TTL和RS-232互转

单片机接口一般是TTL电平,如果接232电平的外设,就需要加TTL转RS232的模块。如下图,可用芯片MAX232进行转换。

RS422串口通信

RS-422有4根信号线:两根发送、两根接收和一根地线,是全双工通信。

它有一个主设备,其余为从设备,从设备之间不能通信,所以RS-422支持点对多的双向通信。

RS485串口通信

RS-485采用平衡发送和差分接收,因此具有抑制共模干扰的能力。

采用两线半双工传输,最大速率10Mb/s,电平逻辑是两线的电平差来决定的,提高抗干扰能力,传输距离长(几十米到上千米)。

+2V~+6V逻辑“1”,-2~-6V逻辑“0”。

TTL转成RS-485很常见,比如MAX485,参考电路如下

RE引脚:接收器输出使能(低电平有效)。

DE引脚:发送器输出使能(高电平有效)。可以直接通过MCU的IO端口控制。

TTL

嵌入式里面说的串口,一般是指UART口。4个pin(Vcc,GND,RX,TX),用TTL电平。

PC中的COM口即串行通讯端口,简称串口。9个Pin,用RS232电平。

串口、COM口是指的物理接口形式(硬件)。而TTL、RS-232、RS-485是指电平标准(电信号)。

单片机与PC通讯示意图如下:

CAN总线

CAN是控制器局域网络的简称,是一种能够实现分布式实时控制的串行通信网络。CAN总线的功能复杂且智能。主要用于汽车通信,相关文章:CAN总线详解。

CAN总线网络主要挂在CAN_H和CAN_L,各个节点通过这两条线实现信号的串行差分传输,为了避免信号的反射和干扰,还需要在CAN_H和CAN_L之间接上120欧姆的终端电阻。

每一个设备既可做主设备也可做从设备。CAN总线的通信距离可达10千米(速率低于5Kbps),速度可达1Mbps(通信距离小于40M)。

CAN电平逻辑

CAN总线采用"线与"的规则进行总线冲裁,1&0为0,所以称0为显性,1为隐性。

从电位上看,因为规定高电位为0,低电位为1,同时发出信号时实际呈现为高电位,从现象上看就像0覆盖了1,所以称0为显性,1为隐性。

USB通信串行总线

USB接口最少有四根线,其中有两根是数据线,而所有的USB数据传输都是通过这两根线完成。它的通信远比串口复杂的多。

两根数据线采用差分传输,即需要两根数据线配合才能传输一个bit,因此是半双工通信,同一时间只能发送或者接收。

USB 规定,如果电压电平不变,代表逻辑1;如果电压电平变化,则代表逻辑0。

USB转TTL

一般USB转串口都是用CH340G芯片。

用串口通信比USB简单,因为串口通信没有协议。

January 3, 2025

液冷解决方案的重要组件Manifold和CDU

在当今时代,数据中心已面临着超过 20 kW的机架功率要求,且市场发展趋势表明,功率要求将攀升至 50 kW 甚至更高。新一代的CPU 与GPU 相较于上一代架构,展现出了更高的热功率密度。与此同时,服务器制造商为满足高性能计算及 AI 应用的加速需求,正不断将更多 CPU 和 GPU 整合于每个机架之中。在此背景下,传统风冷技术的局限性逐渐凸显,其已难以用高效且可持续的方式对这些高密度机架进行冷却。而液冷技术,正作为一种极具潜力的解决方案,走入大众视野,它将如何应对数据中心的散热挑战,开启数据中心散热的新纪元呢?让我们一同深入探究。

探秘液冷系统:五大核心部件全解析

液冷系统主要由以下五个重要部分构成:

  • 液冷服务器

作为整个液冷体系的核心运算单元承载者,它内部的精密元件在液冷技术的呵护下,能够高效地处理海量数据,为各类复杂运算提供坚实的硬件基础。

  • 液冷机柜

不仅为服务器提供了物理上的安置空间,其独特的结构设计与液冷功能的融合,能有效优化服务器的散热环境,保障众多服务器协同工作时的稳定性。

  • Manifold(分水管)

犹如液冷系统中的 “血管脉络”,精准地将冷却液分配到各个关键部位,确保冷却液在系统内的循环路径合理且高效,使散热效果均匀覆盖每一个角落。

  • PDU(Power Distribution Unit,电源分配单元)

在负责电力分配的同时,与液冷系统协同工作,为整个系统的稳定运行提供持续、可靠的能源保障,是保障设备动力源泉的关键环节。

  • CDU(Coolant Distribution Unit,冷液分配装置)

它掌控着冷却液的流量、温度等关键参数,如同液冷系统的 “智能管家”,根据系统的实时需求,合理调配冷却液资源,让散热过程始终处于最佳状态。

这五大部件相互协作、相辅相成,共同构建起了高效可靠的液冷系统。下面介绍一下Manifold和CDU。

Manifold 分水器 / 分水管:液冷系统的关键连接枢纽

在液冷技术的核心架构里,Manifold 扮演着极为重要的角色。它作为连接液冷机柜 CDU 与冷板之间主管路的关键部件,是整个液冷循环通路的重要桥梁。

优质的Manifold通常具有以下特点
  • 超强耐腐蚀与高强度

采用特殊材质与工艺打造,具备出色的耐腐蚀性,能够抵御冷却液及复杂环境的侵蚀,同时拥有高强度,可在长期高压运行环境下稳定工作,保障液冷系统的持久耐用性。

  • 灵活双排管

有单排管与双排管两种类型,充分考虑到用户多样化的应用场景与需求差异,无论是追求高效散热的大规模数据中心,还是空间紧凑的小型设备机柜,都能找到适配的 Manifold 产品,实现精准的冷却液分配与传输。

  • 超高精密度制造工艺

以先进的制造技术,将两分管位置精度控制在正负零点几毫米,这种近乎极致的精密度确保了冷却液在分流与汇合过程中的准确性与稳定性,避免因分流不均导致的局部过热或冷却不足问题,为设备的稳定运行提供了坚实保障。

  • 精湛焊接工艺融合

能融合了激光焊与人工焊的双重优势,在保证焊接强度与密封性的同时,呈现出美观精致的外形。不仅体现了工艺的精湛,更反映出对产品细节的极致追求,使得 Manifold 分水器 / 分水管在功能性与美观性上达到了完美统一。

CDU:液冷系统中的智能热交换核心

在液冷技术的关键架构之中,CDU(Coolant Distribution Unit,冷液分配装置)无疑是极为重要的一环。核心部分由换热器主导,这一关键组件承担着至关重要的热量交换使命,将二次侧(服务器侧)的热量精准地转移至一次侧(冷却塔侧),从而构建起热量传递的关键通道。与此同时,CDU 并非孤立存在,它巧妙地整合了水箱、水泵、过滤网、传感器等多个部件,共同组成了一个相对独立且高度模块化的热交换模块,各个部件协同运作,宛如一台精密的散热机器。

四大核心作用,保障系统稳定运行
  • 防止凝露

CDU 具备卓越的控温能力,能够确保输配给电子设备的冷液温度始终高于空气露点温度。这一特性有效避免了因温差导致的凝露现象,防止水分对电子设备造成损害,为设备的安全稳定运行营造了干燥适宜的内部环境。

  • 隔离保障

通过巧妙的设计,CDU 将一、二次侧冷却介质进行了有效隔离。这种隔离机制极大地提高了机房的安全性,避免了不同冷却介质之间可能产生的相互干扰或潜在危险,使得整个液冷系统的运行更加可靠、有序。

  • 冷液灵活适配

在液冷系统的构建中,CDU 发挥着独特的灵活性优势。它采用对环路进行分离的设计理念,为用户提供了自由选择使用任何冷液的可能。无论是特殊工况下的特定冷液需求,还是基于成本、性能等多方面考虑的冷液替换,CDU 都能轻松应对,大大增强了液冷系统的适应性与可扩展性。

  • 精准温度控制

CDU 所拥有的单独回路是实现精准控温的关键所在。这一回路能够让电子设备始终在期望的温度范围内稳定运行,如同为设备配备了一位精准的 “温度管家”。无论是面对高负荷运算带来的热量波动,还是环境温度变化的影响,CDU 都能迅速响应并调整冷液流量与温度,确保设备始终处于最佳工作状态。

VxWorks