명령어 집합 | |
CISC | AMD64●x86● · M68K · 68xx · Z80 · 8080 · MOS 65xx · VAX |
RISC | AArch64 ARM · RISC-V● · MIPS● · DEC Alpha · POWER PowerPC · CELL-BE LoongArch · OpenRISC · PA-RISC · SPARC · Blackfin · SuperH · AVR32 AVR |
VLIW EPIC | E2K · IA-64 · Crusoe |
vs |
1. 개요
AMD64와 ARM의 성능 비교를 위한 문서다.2. 각 아키텍처의 특징
2.1. AMD64
원래는 1999년에 x86구조를 유지하면서 64비트를 지원하도록 설계된 아키텍처였다. 16비트, 32비트를 넘어 64비트까지 오게된 것. 컴퓨터 역사상 유례없는 대확장이 두번이나 이뤄졌지만 하위 호환성으로 인해 구조가 복잡하다고 말하지는 않는다. 일부 구시대의 잔재가 사라졌지만 그것은 지금 시점에서는 크게 의미를 가지지 않기 때문에 명령어 구조에서는 예나 지금이나 거의 비슷하다.ISA의 특징이라면 일단 CISC이며 IA-16부터 확장되어 온 만큼 구조가 난잡하다. 여러 분야에서 쓰였기 때문인지 다양한 명령어를 지원한다. 그러나 이 사실은 어느 정도 회의적인 것이 지금은 AMD64 시대이고 더이상 레거시 명령어를 사용하지 않는다.[1] 레거시 명령어들을 생각하고 바라본다면 복잡한건 맞지만 그런 부분을 제외한다면 AMD64는 충분히 잘 설계된 명령어 체계인 것이다.[2]
인텔의 8비트 CPU들과 호환성을 가지기 위해 상태 레지스터의 첫번째 바이트는 인텔 8080의 것과 완전히 동일하다. 또한 누산기를 중심으로 사용했던 흔적이 남아있는데 AX 레지스터 전용의 명령어들이 존재한다. 예를 들어 곱셈, 나눗셈 명령과 입출력 명령어는 누산기에서만 실행이 가능하다. 이 내용들은 AMD64에 들어와서도 여전히 해결되지 않았거나 유지되고 있다.
소수점 연산을 위한 x87 명령어 집합은 x86의 성능 향상을 더디게 만들었는데 8레벨의 스택을 가지고 있고 누산기 구조를 사용하고 있다. 다만 AMD64 프로세서의 x87 지원은 단순 하위호환을 위한 지원이고 SSE를 통해 FP연산을 하는 경우가 대부분이고 컴파일러들 또한 일부러 x87명령어를 사용하도록 옵션을 거는게 아닌 이상 SSE를 통한 연산을 수행한다. x87 나눗셈 연산인
FDIV
의 경우 젠3의 경우 15사이클 소모되지만 DIVPS
의 경우 10사이클만 소모한다. AArch64의 FDIV
의 경우 7에서 17사이클.32비트에서는 더 많은 기능을 지원하기 위해 주소 지정 모드를 변경했지만 역할만 약간 바뀌었을 뿐 달라진 점은 거의 없다. 이는 AMD64의 기반이 되었다.
64비트에서는 더 많은 레지스터와 메모리 공간을 지원하기 위해 일부 명령어들이 삭제되고 대신 다른 역할이 분배되었다. 기존의 32비트 명령어들과 구분하기 위해 명령어 앞에 접두사(REX Prefix)가 붙는 것으로 해결했기 때문에 32비트 명령어와 크게 차이나지 않는다 대신 접두사로 인해 같은 기능을 하는 32비트 코드보다 바이너리 크기가 더 증가했다.
AMD64의 가장 큰 장점은 호환성과 단일화라고 볼 수 있다. AMD64 기반 CPU를 설계하는 회사는 사실상 AMD와 인텔밖에 없어 단일화가 잘 되어 있고 SIMD(SSE, AVX, AVX512)나 가상화(VT-x나 AMD-v)와 같은 일부 기능들을 빼면 파편화가 적다. 반면 ARM의 경우 상당 부분 제조사의 커스텀이 자유롭기 때문에 Apple 같은 특이 케이스가 아닌 이상 파편화가 심각한 문제점으로 꼽힌다.
2.2. ARM(AArch64)
ARM은 RISC 철학에 따라 엄격하게 저전력 고효율로 설계된 CPU였기 때문에 고효율은 맞지만 고성능을 의미하지 않았다.엄격하게 고효율성을 생각해서 명령어 집합 구조는 동시대의 다른 CPU들과 거리가 멀다. 그러나 이는 ARMv8 이전의 이야기로 이후로는 다른 RISC CPU들과 큰 차이를 보이지 않게 되었다.
그로 인해 명령어 집합 구조가 크게 바뀌게 되었으며 어셈블리어 구조부터 호환이 되지 않는다. AMD64의 경우 x86은 개인용 컴퓨터 시장이 주류였기 때문에 어셈블리어의 필요성이 높지 않았다. 하지만 ARM은 임베디드가 주 목적으로 C언어보다 어셈블리어가 많이 쓰인다. 그러나 지금은 소프트웨어 규모가 커졌기 때문에 크게 문제될 내용은 아니다.
그래서 두 프로세서의 성능 자체를 비교하는 것은 적절한 비교 방법이 아니다. 각자의 설계 철학, 이념에 따라 갈리기 때문에 한쪽의 일방적인 승리가 아닌 비슷하게 흘러갈 것이다.
ARM의 가장 큰 문제는 파편화이다. x86 계열이 하이퍼바이저 관련 기능 정도만 파편화 되어 있는 것에 비해 (AMD-V, VT-x) 32비트의 IA-32, 64비트의 AMD64만 존재하며 프로세서의 확장 기능 또한 SSE, AVX는 스펙상에 존재하기에 동일한 바이너리 코드가 벤더간 동작에 있어 별다른 문제 없이 호환이 가능한 것에 비해 ARM은 기본 명령어 세트부터 ARM v6/v7/v8/v8-M/v8.1-A/v8.2-A/v8.3-A/v8.4-A/v8.5-A/v8.6-A/v9[3], Thumb1/2/EE, Jazelle, NVIC, VIC, GIC v2/v3/v4 등으로 나뉘어 있는데다 확장 기능도 NEON, SVE, DSP, VFP 등으로 쪼개져 있어 삼성이나 퀄컴이나 모두 똑같은 ARM이지만 기본적인 호환성만 가질 뿐 완전히 다른 CPU라 봐도 무방해 바이너리 코드가 다른 프로세서에서 정상적으로 동작할 것이라는 보장을 할 수가 없고 이는 임베디드용 프로세서도 크게 다르지 않다. 앞으로 ARM이 해결해야 할 큰 문제이고 AMD64와의 경쟁에서 유리한 점은 아니라는 것이다. Apple은 다른 방법으로 해결했는데 아예 폐쇄적인 플랫폼을 만들어서 호환성 문제를 없애고 극한의 최적화가 가능하게 했다. 그 이유는 Apple의 Darwin은 Apple의 칩에서만 구동되기 때문이다. 이 문제 때문에 리누스 토르발스는 ARM보다 x86이 더 낫다면서 ARM에게 실망했다고 발언했다.#
2.3. 비교
x86은 고성능용, ARM은 저전력 고효율용으로 설계된 것은 맞지만 실제로는 기본적인 명령어 집합이 성능에 영향을 끼치는 것은 제한적이다. 이것에 관해서는 관련 연구가 존재한다.[4] 명령어 집합구조(ISA)가 마이크로아키텍처의 설계 및 코어의 성능에 영향을 끼치는 것은 분명하지만 어느 정도의 수준이 되면 마이크로아키텍처 선에서 정리가 될 것이다. 예로 아토믹연산 등에 관한 명령어가 아예 존재하지 않고 락 등을 위한 하드웨어 지원을 발동시킬 명령어 자체가 없는 ISA라면 멀티코어 성능은 그야말로 박살이 날 것이다. 그러나 이정도는 AMD64나 ARM이나 MIPS나 모두 갖추고 있어서 이 부분에 대해선 ISA의 영향력이 크게 떨어진다. 애초에 프로세서의 명령어 구조가 프로세서의 속도에 영향을 크게 미칠 정도였다면 Apple이 사용하는 Rosetta 2 와 같이 백엔드가 어찌 되어 있던 한차례는 AMD64 코드를 디코딩 해야 하는데 그랬었다면 Rosetta 2의 성능이 그만큼 나오지도 못했을 것이다. 애초에 프로세서는 명령어를 받으면 uOp으로 한차례 더 해석되어야 하기 때문이며 이 때문에 마이크로아키텍처 구현 방향이 성능에 더 큰 영향을 주게 된다.x86 명령어 집합은 AMD64에 들어서 확장이 되었지만 여전히 x86-32에서 정립된 구조를 사용하고 있으며 일부 구시대의 잔재가 사라졌을 뿐 여전히 x86이다. 즉 수십년전의 80386과 명령어 집합이 크게 차이나지 않는다. 반면 ARM은 ARMv8로 넘어오면서 명령어 집합을 완전히 갈아엎었고 그 전의 명령어 집합하고는 아무런 호환성이 없게 되었다. 하지만 ARM의 성능이 크게 개선되지는 않았다.
그러나 x86은 MMX, SSE, AVX를 거치면서 성능이 폭발적으로 증가하게 되었고 ARM도 마찬가지이다. 애플의 칩이 성능이 높은 것이 ARM의 성능이 높다는게 아니라 SIMD 기술이 강하다는 것이다. x86도 SIMD 기술 없이 프로그래밍을 할 수는 있지만 그렇게 되면 게임도 못돌린다. 물론 동영상도 제대로 재생할 수 없고 거의 모든 멀티미디어가 불능이 되어 버린다.
SIMD와 같은 프로세서 확장으로 비교한다면 x86계열이 더 앞서 나가 있는데 SSE/AVX가 단순 벡터 연산 명령어에만 국한되어 있지 않고 유틸리티 연산 명령어가 함께 포함되어 있다. 벡터 연산 끼리만 비교해도 ARM의 Neon이 SSE와 동일한 128비트 크기의 레지스터를 가지고 있는 것에 비해 x86의 AVX-512는 256비트(AMD Zen 4),512비트(인텔, AMD Zen 5이후) 크기의 레지스터를 가지고 있어 동일 클럭 기준 스루풋이 더 높다. ARM쪽도 64비트 ISA인 AArch64 부터 최대 2048비트의 SVE가 옵션으로 존재하나 2048비트는 스펙상에만 구현되어 있고, 실제로 SVE를 사용하는 프로세서는 슈퍼컴퓨터를 위해 만들어진 후지쯔의 A64FX 가 512비트의 SVE 벡터를 지원하는 게 전부이다.
반면 x86의 256비트 연산폭을 가진 AVX는 개인 사용자 레벨에서도 흔하게 보급되어 있고 더 나아가 512비트의 연산폭을 가진 AVX-512는 엔터프라이즈와 하이엔드 제품군에 한정되어 있긴 하나 개인 사용자도 사용이 가능한 것에 비해 ARM 시장은 Neon만이 주력으로 사용되고 있다.
AVX-512는 제온 파이를 밀기 위한 정신나간 파편화로 리누스 토르발스가 대놓고 극딜하기에 이르렀었고, E코어 문제로 인텔 코어 12~14세대에서 아예 빼버린 문제가 있지만, 역으로 제온 파이가 망한 덕분에(...) 파편화를 수습하기 시작하는 분위기이며, AVX10이 보급된다면 완전히 해결할 예정이라 2024년 현재 시점에서는 AVX2와 (AVX512FP16를 제외[5]한) AVX10 둘만 고려하면 된다.
명령어 집합별로 고유의 특징적 기능들이 존재하는 것은 사실이나 그 영향력이 매우 심하지는 않을 것이다. 또한 명령어 집합의 우수성은 성능만으로 결정되는 것이 아니며 확장성, 코드의 압축성 등 복합적으로 평가되어야 한다.
3. 역사
3.1. 1980년 ~ 2009년
1980년대 중반에 처음 ARM이 출시되었다. 그리고 x86과 ARM 양 제품은 PC 시장을 타겟으로 경쟁했고, 이때는 x86의 완승으로 끝났다.90년대에는 ARM이 PC를 제외한 제품의 SoC 위주로 사업을 영위하게 되면서 영역이 다른 두 제품이 경쟁하는 일은 거의 없었다.
3.2. 2010년대
2010년 초반부터 AMD64 진영의 인텔 측에서 아톰 계열 제품을 필두로 모바일과 태블릿에 적합한 저전력 제품을 개발하려는 노력이 지속되고, ARM 계열 제품도 Cortex-A15에서는 성능 확보에 중점을 두고 개발되면서 양 제품의 전력소모 갭은 거의 없어진 실정이다.2012년 4월에 출시된 메드필드부터는 ARM과도 충분히 경쟁할 만한 전성비를 보여준다. 결국 전력소모와 성능은 비슷하게 갈 수밖에 없다는 것을 보여주는 좋은 예.
2013년 기준으로 인텔의 신형 아톰 계열 제품인 베이트레일 4코어가 SDP 기준 2W에 터보클럭시의 소비전력 4W, 그리고 성능면에 있어서 기존의 AMD64 코어 아키텍처에 준하는 성능을 보여주면서 전성비와 성능 양쪽 모두에서 괄목할만한 발전을 보여주고 있으며, 실제로도 전성비 상 ARM과 큰 차이를 보이지 않는 상황이고 인텔측에서도 ARM과 대응하기 위해 저가로 프로세서를 공급하고 있으나 아직도 판매량에서는 심히 후달리는 모습을 보여주었다.
2014년 모바일 시장을 타겟으로 하여 설계된 최초의 제품군인 베이트레일 계열 제품이 시장에서 선을 보이기 시작했다.하지만 성능이 기존에 알려진 것보다 뛰어나지 않다. 베이트레일이 채택된 넥서스 플레이어에서의 GeekBench 점수는 ARM의 프리미엄급 제품군 대비 절반 수준에 불과하다. 결국 2014년 동안의 모바일 AP의 성능 경쟁은 Apple-엑시노스-테그라 의 3파전으로 전개되는 양상을 보이게 되었다.
2014년 베이트레일의 발열 문제가 예상했던 것보다 안 좋아 스마트폰용 베이트레일은 출시된 경우가 드물었고 타블렛용 버전인 무어필드 역시 발열 문제를 겪고 있다.
2014년 출하량 4000만 대 목표를 달성하기 위해 주로 중국 화이트박스 업체들을 대상으로 무상에 가까운 가격으로 출시하면서 인텔의 관련 사업부의 적자 규모가 천문학적인 숫자로 불어났다. 그럼에도 불구하고 4000만대 목표 달성이 불투명한 상황. 사실 4000만대 출시에 성공하더라도 전체 모바일 AP SoC 시장의 3%에 불과할 정도의 규모이다. 결국 2014년도 목표치는 2015년도에 4500만 대로 목표를 초과달성한 것으로 확인되었다.
인텔의 14nm 공정 이전이 1년 넘게 지연되면서 베이트레일의 후속작인 체리트레일 역시 2015년 중반으로 1년 정도 지연되었다. 하지만 ARM진영의 탑-티어 업체들은 이미 2014년 말에 14nm 및 20nm 공정으로 제품 양산을 시작하여 공정경쟁에서도 열세에 처하게 되었다. 결론적으로 2014년 기준 모바일 분야에서의 ARM과 AMD64 간의 경쟁은 AMD64의, 특히 인텔의 상식을 벗어나는 행동으로 말미암아 ARM의 부전승으로 끝난 상황이며 AMD64는 전성비나 성능, 경제성 중 어느 하나도 제대로 잡는 데 실패하고 말았다.
2015년 시점에서 몽구스 라는 코드명으로 알려진 엑시노스 8890의 성능 예상치에 세간의 이목이 집중됐다. Apple의 A8 역시 뛰어난 성능을 자랑하며 업계에서의 존재감을 여전히 유지하고 있다.
2015년에 출시한 체리트레일은 22nm에서 14nm로 제조공정이 향상되었는데도 불구하고 클럭이 제자리에 머물면서 성능 경쟁에서 뒤쳐지고 무엇보다 SoC 내에 통합된 주변장치들의 스펙에서도 밀리고 있다. 특히 GPU와 Disk I/O 부분. 모바일 SoC의 라인업을 x3/5/7 시리즈로 명칭을 변경하고 CPU 설계 IP를 중국 락칩사와 공유하여 SoFIA라는 제품군을 신설했다. 해당 제품은 락칩사가 TSMC 28nm 공정을 이용하여 만들 예정.
2015년 1월 6일 CES 2015에서 인텔은 쿼크 SE를 발표했다. ARM의 Cortex-M에 대응되는 제품이며 SE제품의 발표로 인텔은 ARM의 Cortex-A/R/M 라인업에 대응하는 체계를 완성하게 되었다. Cortex-M만 해도 6종의 제품이 출시된 반면 AMD64는 이제 쿼크 SE만 출시했을 뿐이다.
2016년 ARM 진영의 대표주자인 스냅드래곤 820과 엑시노스 8890 모두 걸출한 성능을 안정적으로 보여주면서 플래그십급 제품으로서의 위상을 확고히 다진 반면 인텔의 x3/5/7 시리즈는 하이엔드 스마트폰 시장으로의 진출에 아예 실패하면서 양자 사이에 성능 경쟁 자체가 성립될 수 없는 상황이 계속 이어졌고 결국 2016년 4월 29일, 인텔이 아톰 모바일 SoC 개발을 중단한다고 밝힘에 따라 인텔은 결국 모바일 SoC 시장에서 사실상 완전히 패배해 버렸다. #
2016년 AMD가 시애틀이라는 서버용 ARM 칩을 출시했지만, 별로 크게 재미는 못 봤다.
2017년 Apple의 A11 Bionic이 전작 A10 Fusion에 비해서도 성능이 비약적으로 증가하면서 긱벤치 상으로 스카이레이크 이후의 AMD64 기반 CPU들에 근접하는 성능을 가지게 되었으며, ARM진영 내에서도 거의 독보적인 성능 지위를 확보하기 시작했다. 특히 ARM 아키텍처의 특성상 전성비가 상당히 높으며 Microsoft의 ARM 프로세서에 대한 Windows 지원 계획이 성공할 경우 AMD64에 대한 분명한 위협이 될 것으로 보인다. 앞으로 SoC 시장에 AMD64가 내려와 경쟁하는 것보다 ARM이 체급을 올려 일반 데스크톱 시장에서 AMD64를 추격하는 모양새가 될 확률이 높다.
2018년 1월에 삼성에서 독자적으로 커스텀한 M3 몽구스 코어를 기반으로 한 엑시노스 9810 이 발표되었다. 출시 전에는 긱벤치 4에서 멀티쓰레드 점수 10000점에 근접하는 등 스냅드래곤을 훨씬 능가하고 Apple의 A11 Bionic과 맞먹는 벤치마크 점수를 선보이며 모두의 기대를 모았지만 실성능은 한심하게 낮은 성능을 보여 실망을 안겼다.
2018년 11월 26일 AWS에서 ARM기반 Graviton 프로세서를 사용하는 EC2 A1 인스턴스를 공개했다.출처영상
2019년 기준으로 몇 년간 루머로 나왔던 ARM을 탑재한 Windows 10과 macOS가 2020년에 공개된다는 정보가 슬슬 풀리기 시작했는 데 Apple의 경우, 아예 인텔 쪽에서 Apple이 인텔 CPU를 버리고 자사 칩을 2020년부터 탑재할 것이는 기사가 나온 상태다. 게다가 2021년까지 iPadOS와 macOS 둘 다 쓸 수 있도록 통합할 계획도 나온 상태다. Microsoft의 경우, 이미 ARM 기반 컴퓨터에서 돌릴 수 있는 Windows 10이 프로토타입으로 나왔고 이쪽도 ARM을 탑재한 Surface Pro X를 발표했다. 그러나 비싼 가격과 낮은 성능으로 컴퓨터 시장에 큰 변화를 가져오진 못 했다. Microsoft의 ARM 기반 Surface의 성능이 부족한 것은, 실시간으로 x86 프로그램을 에뮬레이팅하기 때문이다. ARM 포팅된 프로그램들은 성능 하락 없이 실행된다.
삼성과 퀄컴 모두 커스텀 아키텍처를 포기했다. 퀄컴은 S865에서 커스텀 코어가 아닌 A77+A55를 조합했고 삼성은 자체 코어를 개발하는 몽구스 프로젝트를 해체했다. Apple의 A13 Bionic은 여전히 삼성과 퀄컴 등 경쟁 회사의 프로세서를 훨씬 능가하는 막강한 성능을 자랑하며 ARM 진영 선두주자의 위엄을 유지했다.
유니티는 구글 플레이 스토어의 64비트 의무화등 때문에 64비트 대응 준비 하면서 사용현황을 검토했더니, 시장에 보급된 x86 기반 Android 기기의 수가 매우 적은 것으로 나타났다. Unity 2019.2부터 x86 기반 Android 지원을 중단하기 시작했다.[6] 유니티 엔진을 사용하는 게임의 사례
2019년 12월 3일 AWS에서 ARM기반 Graviton2 프로세서와 이를 사용하는 EC2 M6g, C6g, R6g 등의 인스턴스를 공개했다.출처영상
아난드텍 리뷰에 따르면 AMD EPYC 7571, intel Xeon Platinum 8259CL과 비교했을 때 절반가량의 TDP에도 불구하고 비슷하거나 뛰어난 성능과 저렴한 가격으로 가성비에서 상당한 우위를 차지한다.
3.3. 2020년대
2020년 6월 11일, AWS는 2019년 12월 3일에 발표한 6세대 EC2 인스턴스를 GA로 전환했다.2020년 6월 22일, Apple은 WWDC 2020 발표회에서 12.9형 iPad Pro 4세대에 이미 탑재됐던 A12Z Bionic 칩에 RAM을 16GB 확장한 개발자 전환 키트[7]로 macOS를 시연했는데, 여러 개의 4k영상 동시 렌더링이나 5GB의 psd파일을 포토샵에서 끊김 없이 처리해내는 우수한 성능을 보여줬다. Rosetta 2를 통한 x86 에뮬레이팅도 시연했는데 여기서 마야의 렌더링 작업과 쉐도우 오브 더 툼 레이더를 비록 옵션에 타협은 있었지만 1080P해상도에 60프레임으로 구동해냈다. 네이티브가 아니여서 성능이 낮을 수밖에 없는 에뮬레이팅임에도 불구하고 낮지 않은 성능을 보여주었기에 상당히 인상적이다.
2020년 6월 22일, 후지쯔에서 개발한 ARM 기반 슈퍼컴퓨터 후가쿠가 전세계 슈퍼컴퓨터 1위를 차지했다. 해당 슈퍼컴퓨터의 연산성능은 415.5PFLOPS로, 기존 1위였던 IBM POWER 기반 슈퍼컴퓨터의 연산 성능인 148.8PFLOPS의 2배 이상이다.[8]아난드텍 리뷰
단순 연산속도 뿐만 아니라 산업 이용 능력 평가치 HPCG 및 빅데이터 능력 평가 Graph 500, AI성능 평가 HPL-AI 등 모든 부문에서 세계 1위를 차지했으며, 이렇게 한번에 모든 분야에서 세계 1위를 기록한 것은 후가쿠가 처음이다. Apple의 Apple Silicon과 함께 ARM은 x86보다 뒤처진다는 기존 선입견을 박살낸 사례 중 하나이기도 하다.
2020년 11월 11일, Apple은 차세대 MacBook Air, 13형 MacBook Pro, Mac mini 용으로 개발된 M1 칩을 공개했다. 이 칩은 iPhone 12에 탑재된 A14 Bionic 기반으로 만들어졌기에 Firestorm + Icestorm 코어 조합이다. Apple Firestorm은 8-Wide 디코더 구조를 가지는데, 이는 현용 CPU 역사상 가장 넓은 아키텍처에 속한다. 백엔드 면에서도 Apple의 Firestorm은 7개의 정수 실행 유닛과 전작 대비 33% 확장된 4개의 FP/Vector 연산 유닛을 보유한다.
2020년 11월 13일, 데스크탑용 벤치마크 툴인 시네벤치 R23버전이 업데이트되면서 Apple Silicon 버전 macOS를 지원하기 시작했다. 여기서 저번 6월에 공개됐었던 A12Z Bionic이 탑재된 개발자 킷의 벤치마크가 유출되었는데, 점수는 싱글 987점, 멀티 4530점으로 나왔다. 이는 AMD Ryzen 5 2400G와 비슷한 점수다. 랩탑 라인업에서는 Intel Core i5-1035G7과 비슷하다.
2020년 11월 16일, Apple M1 탑재 MacBook Air의 Rosetta 2 에서 돌아간 긱벤치 점수가 공개되었다. 즉 M1에서 x86 mac을 에뮬레이팅한 것인데, 점수는 싱글 1300점, 멀티 5800점으로 이는 현존하는 Apple의 모든 인텔 Mac보다 싱글코어 점수가 높고 멀티코어는 i7-9750H보다 10%가량 높다. 사실상 M1을 x86으로만 돌려도 대부분의 인텔 Mac 성능을 능가한다는 것이다. 참고로 네이티브 환경에서 긱벤치를 돌렸을 때의 80% 정도의 점수다.
2020년 11월 17일, Apple M1 탑재 13형 MacBook Pro의 시네벤치 R23 버전 점수가 공개되었다.# 싱글 약 1500점, 멀티 약 7500점으로 싱글점수는 라이젠 5600X, 멀티점수는 라이젠 2600X와 비슷한 점수이며, 저전력 프로세서와 비교하면 싱글코어는 i7-1165G7과 비슷하며#, 멀티코어는 라이젠 4600u 보다 낮은 수준이다.# 긱벤치상으론 싱글코어 1700점대, 멀티코어 7500점대로 상당히 높은 점수를 자랑하며 이마저도 전력소모량과 발열량까지 따진다면 오히려 x86쪽에서 비교할만한 CPU가 사실상 없는 상태다.
2021년 기준으로 여러 기업들이 애플의 뒤를 따라 독자적인 ARM칩을 개발하기 시작했으며 대부분 기업들이 인텔으로부터 벗어나려고 ARM 칩을 개발한다는 공통점이 있다.
- 퀄컴도 M1을 경쟁상대로 보고 있으며 14인치 노트북에 32GB 램이 탑재된 프로토타입이 나왔다고 밝히고 있다. 그렇지 않아도 M1맥으로 ARM 윈도우를 에뮬했음에도 불구하고 서피스 프로 X보다 더 높은 성능을 보여줌으로써 퀄컴에게 굴욕을 선사한적이 있었다.[9] 또한 퀄컴이 애플 출신이 만든 CPU 스타트업을 인수함으로써 적극적으로 개발하고 있다.
- 인텔의 경우, 애플의 M1을 여러번 언급하면서도 M1보다 더 좋은 칩을 만들어야 한다는 기사들이 나왔는데 정확히 설명하자면 애플같이 칩을 전문으로 생산하지 않는 회사에 뒤쳐지고 있다는식의 내용이다. 다르게 보자면 애플을 겨우 일반적인 회사로 취급하고 있는 셈이다.[10]
- WWDC 2020에 이미 언급했지만 2022년까지 모든 인텔맥들이 애플 실리콘으로 대체될 예정이고 심지어 워크스테이션 데스크탑인 맥 프로까지 확실히 대체될것으로 보이며 이미 아이맥 시리즈와 맥 프로 시리즈가 개발중이며 그중 아이맥은 올해내로 나올걸로 보인다. 맥 프로의 경우, 타워형은 당분간 인텔맥이겠지만 애플 실리콘기반이자 기존 타워형에 비해 반쪽 크기인 일명 소형 맥 프로가 따로 개발되고 있다고 블룸버그가 기사를 내놓았다. 14인치와 16인치 맥북프로도 올해(2021년) 애플 실리콘 기반에 완전히 새로운 디자인으로 등장할 예정이다.
- AMD쪽에서도 M1과 경쟁할 ARM칩을 개발하고 있다는 기사가 올라왔으며 아예 AMD CEO가 CES 2021에서 애플의 M1칩은 혁신의 기회라고 언급한 상태다.
- Microsoft에서도 애플 실리콘칩에 탄력을 받아서 서피스 PC를 위한 독자적인 ARM기반 프로세서를 개발하고 있는 상태다. 아예 자사 서버까지 ARM 기반으로 넘어가려고 독자적으로 개발 중이니 애플에 이어 Microsoft까지 탈인텔을 시전중이라 할 수 있다.[11] 이미 구글과 아마존이라는 큰 경쟁사들도 ARM 기반을 준비하기 시작한 상태다.
- 구글도 자사 노트북과 스마트폰을 위한 독자적인 칩을 개발하고 있다.##
2021년 2월 6일, 인텔이 대놓고 애플의 M1을 겨냥한 보도자료를 올렸다. 해당자료에 의하면 타이거 레이크가 더 우수하고 M1은 제한적이고 거짓이라는 내용인데 사실상 인텔이 Apple Silicon을 직접적인 경쟁자로 취급할 정도로 크게 경계하는 셈이다.[12] 엔트리급 레벨에 불과한 M1칩에 대해 이렇게까지 반응하는 정도라면 ARM 진영을 크게 의식하는건 확실하다.
2021년 3월 3일, 애플이 애플 실리콘으로 이주하면서 추가한 번역기인 로제타 2가 11.3 업데이트에서 일부 지역에서 사라질 수 있다는 유출이 나왔다. 로제타 2가 사라지면 더 이상 x86 프로그램을 Apple Silicon 기반 Mac에서 쓸 수 없기에 논란이 되고 있다.
2021년 3월 10일, Petapixel이란 블로그에서 정식으로 애플 실리콘에 최적화되어서 출시된 포토샵을 테스트했는데 뛰어난 성능을 보여준다는 결과가 나왔다. 비교대상으로 Dell XPS 17에 인텔 코어 i9-10875H, 32기가의 램, 그리고 엔비디아 RTX 2060 Max-Q를 탑재한 버전으로 가격과 체급차이가 무척 차이남에도 불구하고 소폭 앞서는 결과를 보였다.[13] 특히 Photomerge 항목에선 그동안 리뷰한 16인치 맥북프로와 레이저 블레이드 스튜디오를 포함해 어떤 노트북도 100점을 넘은 적이 없었는데 130점을 넘었다고 한다. 대신 GPU 항목에선 RTX 2060에 비해 40% 수준의 점수를 기록했다. 당연하게도 로제타 2로 돌린 포토샵보다 훨씬 더 빠르며 인텔 H 시리즈급 성능을 보여준다는건 전성비가 매우 뛰어나면서도 실질적인 성능도 높다고 볼 수 있다. 결정적으로 M1칩은 겨우 인텔의 Y 시리즈에 해당되는 체급이라 상위버전들이 등장한다면 더더욱 높은 성능을 보여줄 수 있어 보인다.
2021년 4월 13일, 엔비디아가 처음으로 데이터 센터용 CPU를 개발 및 생산할 예정이라고 발표했다. ARM 기반 CPU이며 인텔과 AMD의 직접적인 경쟁자가 된다고 언급까지 하고있다. 2023년부터 출시할 에정이며 사실상 인텔의 제온 시리즈와 AMD EPYC 시리즈를 직접적으로 겨냥 및 경쟁할 예정이라 보아도 무방하다.
한편 MediaTek은 Chromebook과 스마트폰을 위한 칩에 엔비디아 그래픽 API를 탑재한다고 발표했다. 삼성이 AMD 그래픽을 쓰는 것처럼 MediaTek은 엔비디아 그래픽을 쓰는 것으로 모바일 ARM칩의 그래픽 성능이 기존보다 훨씬 더 개선될 것으로 예측되고 있다.[14]
2021년 6월 19일, 삼성과 퀄컴이 다시 커스텀칩 개발에 돌입했다고 한다. 기존에는 애플처럼 CPU와 GPU 둘다 커스텀으로 개발한다고 하는데 삼성과 퀄컴이 시도했었지만 실패함에 따라 커스텀화를 포기했었다. 하지만 상황이 계속해서 변하고 있음에 따라 다시 커스텀칩 개발에 돌입한걸로 보이며 퀄컴의 경우, 애플칩을 개발한 인력들이 창립한 누비아를 인수함에 따라 퀄컴도 다시 도전할걸로 보인다.[15]
2021년 6월 25일, Microsoft가 차세대 운영체제인 Windows 11을 발표했으며 macOS Big Sur처럼 x86과 ARM 둘다 지원하고 특히 Android 앱을 인텔 브릿지 기술로 그대로 사용할 수 있는 큰 변경점이 생겼다. 또한 Windows 10 on ARM에서 지원되지 않았던 64bit 프로그램 에뮬레이션도 드디어 공식적으로 지원함에 따라 기존 64bit x86 소프트웨어를 ARM 기기에서도 돌릴 수 있게 되었다. 또한 x86 코드에 ARM코드를 섞어쓸 수 있다고 한다. Apple Silicon맥 이후로 이렇다할 ARM 운영체제가 생긴 셈인데 타회사들의 유입이 본격적으로 이루어질걸로 추정된다.[16] 특히 애플이 모바일앱을 맥에서 돌릴 수 있다면서 정작 모바일 개발자들이 전혀 관심이 없어 하는 상황이라 Windows 11이 모바일앱 부분에서 앞지를 가능성이 있다.[17]
2021년 7월 19일, Nvidia가 ARM 플랫폼에 RTX와 DLSS을 제공한다고 한다. ARM 플랫폼에서도 게이밍 점유율을 올리려고 한다는 내용이 기사에 있으며 Nvidia랑 협력중인 MediaTek가 Nvidia GPU를 탑재한 노트북 ARM SoC칩인 Kompanio 1200를 개발중이라고 한다.[18] 사실상 ARM 기반 컴퓨터도 RTX와 DLSS를 사용함으로써 게이밍쪽으로도 확장할 수 있을걸로 보인다. 이미 레이 트레이싱을 무려 Linux 기반 Chromebook에서 울펜슈타인 영 블러드를 돌리는 데모 영상이 있다.
2021년 8월 5일, 구글이 드디어 독자적인 칩인 구글 텐서칩을 개발해서 구글 픽셀에 탑재했다.# 기존 구글 픽셀 스마트폰들은 퀄컴의 스냅 드래곤을 채용했었지만 텐서칩을 개발함으로써 퀄컴칩을 대체하게 되었다. 기존 퀄컴기반 노트북들도 구글이 독자적으로 개발한 칩으로 대체할 가능성이 있다. 또한 텐서칩을 쓴 Chromebook을 2023년까지 내놓는걸 공식적으로 인정했다.#
2021년 9월 16일, AMD가 고객의 요구가 있다면 ARM칩을 생산할 준비가 되어 있다고 입장을 밝혔다.#
2021년 10월 18일, 애플이 14/16인치 MacBook Pro를 공개하면서 M1 Pro와 M1 Max라는 차세대 칩도 공개했으며 역대급 성능과 전성비로 인해 매우 큰 주목을 받고 있다. 특히 GPU의 경우, 전력 소모량은 상당히 낮은데도 불구하고 성능은 모바일 3060과 3080급으로 추정될정도로 뛰어난전성비를 보여주고 있다. 실제로 32코어 기준으로 프리미어 프로와 다빈치 리졸브에선 모바일 RTX 3080다운 성능 혹은 그 이상을 보여주고 있다.[19]
2021년 10월 27일, 인텔 12세대 CPU가 발표되었다. 성능은 전세대 대비 상당한 상승을 보였는데 ARM칩과 비교해서 주목할 점이라면 전압과 클럭, 코어를 조절해 모바일 프로세서와 비슷하게 셋팅할 경우 M1 맥스와 성능과 전성비로 밀리지 않는다는 실험결과가 나왔다.[20][21] 추후 정식 모바일버전으로 출시될 경우 재확인이 필요할 듯.
2021년 11월 22일, Microsoft와 퀄컴간의 비밀 계약으로 인해 Windows 11 및 ARM 기반 Windows가 다른 컴퓨터에 지원되지 않았다는 소식이 나왔다. 마소-퀄컴 계약이 곧 끝난다고 하니 추후에 삼성이나 애플은 물론 다른 회사들도 ARM 기반 컴퓨터에 Windows 11을 사용할 수 있을걸로 보인다. [22]
2022년 2월 15일, 인텔이 무려 x86 CPU 라이센스를 타회사에게도 공개할 예정이라고 한다. # 즉, Intel과 AMD 외에도 x86 기반 CPU를 개발할 수 있게 된다는 얘기다!
2022년 2월 25일, 밸브 코퍼레이션과 AMD의 협업으로 Zen 기반의 SoC가 등장했는데, 5W 미만, 로드시 15W대로 동작하는 AMD64 프로세서가 등장하며 x86, CISC 디코더를 가지고 있어 전성비가 좋지 않다라는 인식을 반증하며 ARM 계열 SoC들의 전성비 격차를 좁혀가는 모양새를 보여준다.[23]
2023년 5월, AMD에서 Z1 SoC가 발표된다. 그래픽 프로세서와 CPU가 모두 사용되어도 30W 전후의 소비 전력을 보여주고 이를 탑재한 핸드헬드 게이밍 PC들이 등장한다. 이 때 전성비는 Apple의 M3와 비슷한 수준이다. 비슷하게 Intel 또한 비슷한 프로세서를 출시했으나 실 제품 (MSI Claw)는 떨어지는 전성비를 보이며 x86계열 프로세서의 떨어지는 전성비는 그 자체로서의 문제가 아닌 Intel의 전성비 설계 문제가 더 크게 보이는 상황이다.
4. 전망
4.1. ARM 우세
먼저 x86이 고성능에 적합하다는 편견은 ARM의 ISA(Instruction Set Architecture, 명령어 집합 구조) 자체가 고성능에 적합하지 않다는 시각에서 나온다. 이는 마이크로아키텍처와 ISA를 착각했기 때문에 나오는 오해다. 과거에 ARM의 마이크로아키텍처는 철저한 저전력과 그 범위 내에서의 성능을 추구한 물건이었고, 이것은 고성능 작업에 적합하지 않다는 것이 사실이다. 그러나 고성능으로 디자인되는 것은 ISA의 문제가 아니다. 고성능 마이크로아키텍처로 설계하면 ARM도 충분히 고성능이 나오고, 실제로 이미 나오고 있다. 오히려 x86은 ISA부터 잘못 만들었다는 평을 듣는 정도의 물건이다.일부에서는 ARM 프로세서의 성능이 비약적으로 향상된 것은 사실이지만, x86을 대체할 수 있을 정도는 아니라는 말을 하기도 한다. 그러나 이는 실제와는 거리가 멀다. 우선 ARM 프로세서의 성능은 매우 엄격하고 제한된 환경에서만 구현 가능한 것이라는 자체가 이상한 접근이다. x86 기반의 시스템이 유지되는 것은 현재 PC와 서버 시장을 장악하고 있는 x86 아키텍처 자체에 기반을 둔 소프트웨어 호환성과 인프라가 대부분이기에 바꿔서 얻는 성능 이익에 비해 전환 비용이 더 크다는 것이 진짜 큰 이유다. 폐쇄적 환경으로 그러한 영향을 덜 받은 Apple은 아키텍처 전환에 큰 문제 없이 전성비적으로도 성능적으로도 큰 이익을 얻었다. 레거시 환경의 핵심을 이루고 있는 MS까지 괜히 나서서 WoA 같은 거 만드는 게 아니다. 아닌게 아니라 x86의 성능 향상 한계에 조금이라도 대비하는 것이다.
심지어 후지쯔에서 제작한 ARM 슈퍼컴퓨터 후가쿠가 단순 연산속도 뿐만 아니라 산업 이용 능력 평가치 HPCG 및 빅데이터 능력 평가 Graph 500, AI성능 평가 HPL-AI 등 모든 부문에서 세계 1위를 차지했다. x86의 영역으로만 보이던 HPC 영역에서 ARM 기반 컴퓨터가 세계 1위를 차지하며, "ARM은 고성능을 못 낼 것이다" 라는 말이 쏙 들어가게 되었다. 이렇게 한번에 모든 분야에서 세계 1위를 기록한 것은 후가쿠가 처음이며, 동시기에 나온 Apple의 Apple Silicon과 함께 ARM은 x86보다 뒤쳐진다는 기존 선입견을 박살낸 사례로 평가받고 있다. 게다가 슈퍼컴퓨터에 Nvidia GPU들도 많이 사용되지만 정작 후가쿠는 CPU만 사용해서 세계 1위를 달성한 것이다.
이러한 성과에도 ARM 기반은 x86의 시장을 완전히 잠식할 수는 없다. 레거시 소프트웨어들이 x86 아키텍처에 맞춰져 있으며, 기존의 명령어셋을 모두 갖추고 있는 만큼 호환성 걱정도 없기 때문에 성능이 부족하면 막말로 스케일 업 하면 끝이고, 소프트웨어를 새로 개발할 필요도 없기 때문이다. 또한 그동안 업계에선 ARM을 이용해 고성능을 내볼 생각조차 없었기에 ARM의 성능 향상이 전환 계획이 있던 Apple을 제외하면 인프라도 없고, 컴파일러의 최적화도 영 미흡한 수준이었다. 그러나 이런 흐름도 달라지고 있는 신호라고 볼 수 있는게, ARM이 고성능을 위한 ARM Cortex-X 시리즈를 2020년에 내놓았다. ARM은 고객사에 ISA를 라이센스하고 마이크로아키텍처를 라이센스 한다. 고성능 ARM에 대한 수요가 발생하고 있다는 것이다. 이 때문에 Apple, IBM, 모토로라의 Mac+PowerPC 조합을 박살내며 승승장구하던 윈텔 진영도 인텔의 부진과 마이크로소프트가 Windows 10 on ARM을 내놓는 등 흔들거리고 있다.
- 호환성
여러 번 말하지만 ARM은 x86과 마찬가지로 범용 연산을 할 수 있다. 따라서 유연성이라는 말 자체가 말이 안 되는 이야기다. 호환성 차원에서 얘기하면 조금 얘기할 수 있겠지만, 이 마저도 일부 사실과 다르다. x86 아키텍처는 처음부터 30년이 넘게 개방된 플랫폼이었다. 그렇기 때문에 지금까지 x86 호환 프로그램은 어떤 경우에도 다른 운영 체제 보다 소프트웨어 숫자나 개발 환경에서 열세였던 적이 없다. 어떤 기능이 필요할 경우 인터넷을 뒤져보면 웬간해서는 거의 개발되어 있거나, 개발 도구들을 찾을 수 있다. 물론 이것은 사실이다. 그러나 x86 플랫폼만이 전용 하드웨어가 개발되어 있지 않아도 기존 하드웨어나 다른 명령어, 소프트웨어를 이용하든 해서 어떻게든 기능을 구현할 수 있는 것은 아니다. 그건 일반적인 범용 프로세서면 다 된다. DXVA를 예시로 든다면 DirectX의 드라이버 기능이지 x86의 기능이 아니다. 영상을 소프트웨어로 재생하는 것도 마찬가지다. 당장 Android 폰에서도 소프트웨어 코덱으로 영상 잘만 본다. 플루이드 모션의 예를 들어서 ARM 프로세서라면 해당 기능을 내장해야만 구현 할 수 있지만, x86 플랫폼은 SVP, 드미트리 렌더, avisynth나 vapoursynth 등을 이용해서 플루이드 모션의 대체재까지 만들어 낼 수 있다는 이야기가 그럴듯하게 들린다면 이는 잘못 이해하고 있는 것이다. 이런게 가능한 x86의 특별함이라면 그건 그 동안 쌓아올린 레거시라고 할 수 있으면 있지, ARM으로는 그런 프로그램을 못 만들어서가 아니다. 여태까지 ARM은 그런 프로그램을 만들 필요가 없던 영역에 있었을 뿐이다. 갖은 기술적 스펙을 따지며 ARM은 범용 연산을 못 한다고 주장하는 측에서도 막상 그래서 ARM에서 못하는 연산이 무엇이냐고 물으면 구체적 예시는 정작 들지도 못한다. 과거 ARM용으로 데스크탑 앱들은 시도조차 안하고 모바일 앱들만 나오던 시절에야 예시를 들 수 있었겠지만 이젠 아니기 때문이다. 애초에 호환성은 x86 개발자 및 개발사가 지원할 의지가 있다면 해결될 수 있는 문제로 단지 완전히 새로운 플랫폼이다 보니 수익문제로 인해 안하는 경우가 대부분일 뿐이다. 결국 Microsoft쪽에서 본격적으로 다른 회사들을 위한 Windows를 만들 의지가 있다면 가능성이 있긴하다.[24]
- CPU 언코어 성능
x86 마이크로아키텍처의 CPU 내부 & 메모리 버스 대역폭 확장, 대용량의 캐시 메모리 탑재, 인터커넥트에도 사용되는 PCI Express 총 대역폭과 레인 개수 등 다양한 분야의 언코어 성능 개선이 ARM에서는 이루어지기 어렵다는 것도 사실이 아니다. ARM의 ISA는 저전력 마이크로아키텍처를 만들 수 있도록 컴팩트하게 설게된게 물론 맞다. 그러나 그건 어디까지나 ISA 차원이다. 반대로 말하면, ARM이 위와 같은 고성능 언코어를 선택하지 않을 이유가 전혀 없다. 다 일반적으로 사용 가능한 기술이기 때문이다. ARM이 고성능을 지향하면서 동시에 저전력을 지향하는 것은 전혀 불가능하지 않다. x86보다 전성비 좋은 고성능이면 되는, 비교 우위의 문제기 때문이다. 최근 컴퓨터 기술이 CPU의 코어 속도가 충분히 빠르기 때문에 언코어 성능 개선이 더 체감 속도가 크다는 이유라면, 오히려 제한된 전력 환경 내에서는 ARM이 잉여 전력을 언코어에 투자할 수 있어서 유리하기까지 하다. 그리고 x86 옹호 측 문단에서는 이미 CPU의 연산성능이 한계에 달했으며 언코어 성능의 개선이 더 중요하다고 이야기했는데, 이건 인텔이 태업하던 수 년간 주장하던 논리와 정확히 일맥상통한다. ARM을 디스한답시고 AMD를 깎아내리는 논리다. 당장 ZEN 2에서 ZEN 3으로 넘어가면서 CPU의 성능이 무려 30%나 증가했는데[25] 그럼 이건 무엇인가? AMD가 멍청해서 그러는 건 아닐 것이다. 게다가 마치 ARM은 언코어를 등한시하고 x86 진영만 언코어를 신경쓴다는 것처럼 서술했는데 이거야말로 중대한 오해로서 2020년 현재 대부분의 ARM 플래그십 프로세서도 언코어 면적이 CPU 면적보다 압도적으로 큰 건 똑같다. Apple M1의 경우를 보면 CPU + GPU + NPU 를 죄다 합쳐도 언코어 면적이 더 넓다.
- 프로그래밍
프로그래밍의 효율성은 물론 그럴듯하게 들린다. 그러나 실제로 이런 것이 영향을 주려면 모든 프로그래머가 코드에 인라인 어셈블리를 쓰는 정도가 되어야 하는데, 프로그래머가 그렇게 우수하지 못하다는 말을 하는 것은 모순이다. 실제로 바로 그런 이유로 현대 프로그래밍은 최적화의 많은 부분을 컴파일러에 의존[26]하며, 점점 구현도 많은 부분을 라이브러리에 의존하고 있기 때문이다. 애초에 컴파일러를 만드는 소수의 문제에 가깝다는 것이다. 일부 소프트웨어 기능은 x86에 의존적이긴 하지만, 기존의 ARM은 빌드머신으로 쓰기에 성능이 나빴기 때문에 그러한 기능을 굳이 만들 필요가 없었던 것이다. 오히려 이런 상황에도 불구하고, 지난 수년간 급격한 발전으로 현재의 벤치마크 성능을 보이는 상황이라고 표현하는 것이 맞다.
- 경로 의존성
ARM Linux 기반의 서버를 시장에서 찾아보기 어려운 이유는 간단하다. 기존에 잘 돌아가던 x86 기반의 서버를 버리고, 아직 소프트웨어가 만성적으로 부족한 ARM을 써야하냐는 것이다. 인텔에서 AMD로 넘어가는 것도 어려워하는 곳이다. 그간 서버 시장에서 성능 경쟁에서 밀렸던 non-x86 유닉스 서버들도 잘만 팔렸고, x86의 현 상황도 마찬가지인 것이다. ARM 네이티브 프로그램이 없는 것이 첫번째 이유다. 웹 서버 같은 기존 소프트웨어 의존도를 낮출 수 있는 영역이라면 모를까. 어쨌든 AWS는 벌써 ARM 기반의 인스턴스를 제공하고 있다. 이 문제가 정확히 반대로 적용된 것이 인텔의 Android를 통한 모바일 AP 시장 진출이었는데, 아톰 프로세서들은 벤치마크 성능상으로는 당시의 Android AP를 압도했으나 실성능은 그야말로 형편 없었다. 사실 당시 아톰의 성능은 타 Android AP에 비해 앞섰다. 문제는 대부분의 어플리케이션들이 이미 ARM용으로 최적화되어 x86과는 맞지 않았다. 이러한 성능 문제 외에도 여러가지 문제점의 결부로 인텔은 모바일 AP 시장에서 철수했다.
- 경쟁
2021년 이후로 애플의 M1칩에 따라 독자적인 ARM칩을 개발하는 회사들이 늘어나면서 경쟁이 매우 치열해질 수 있다는 장점이 생긴다. x86의 경우, CPU 제작회사는 오로지 인텔과 AMD로만 한정되기에 사실상 옵션은 두 가지밖에 없고 이마저도 인텔이 대부분 독점하고 있지만 ARM기반 컴퓨터가 본격적으로 등장한다면 얘기가 달라진다. 현재 ARM기반 컴퓨터를 위한 칩을 개발하는 회사는 Microsoft, 구글, 애플, 엔비디아, 아마존, 테슬라, AMD, 삼성, 퀄컴 등등 무수히 많으며 특정 시장에 따라 경쟁자들이 대거 출몰할 가능성이 생긴다. 서버의 경우, 대부분 인텔 CPU를 쓰지만 Microsoft, 구글, 아마존 등등이 독자적으로 개발한 ARM칩을 쓴다면 인텔의 점유율이 점점 떨어질 수밖에 없고 회사 간의 경쟁이 무척 치열해질 수 있다. 그래픽카드 시장까지 확장된다면 AMD와 엔비디아도 새로운 경쟁자가 생기기에 긴장할 수밖에 없다.[27] 아직 극초기라지만 ARM칩을 개발하는 회사들이 얼마든지 AMD64시장이 차지한 시장에 들어올 수 있기에 결코 만만하게 볼 수 없다. 엔비디아가 인텔 제온에 대응하는 ARM기반 CPU를 개발해서 2023년부터 쓴다고 발표함에 따라 주가가 상승하기도 했다. 결정적으로 2021년 기준으로 x86에 집중하겠다는 회사는 인텔밖에 없다. Microsoft가 Windows 11을 내놓았고 ARM버전도 제대로 지원하는건 물론 x86 소프트웨어를 ARM에서 돌리면서 네이티브급 성능을 보장을 하는 등 호환성까지 모두 챙길 예정이기에 경쟁이 더 심화될걸로 보인다.
이미 M1칩만 해도 작업용 소프트웨어상의 성능이 체급차이를 무시하고 능가하는 경우가 발생하고 있다. # 프리미어 프로와 라이트룸은 TDP부터 45W인 H 시리즈를 능가하며 이마저도 외장 그래픽카드가 달려있음에도 불구하고 M1이 더 앞선 결과를 보여줬고 베타 버전인데도 이런 성능을 보인 것이다.
4.2. x86 우세
현대의 컴퓨팅 기술은 고성능, 저전력, 유연성이라는 세 가지 서로 다른 목적을 동시에 달성할 수 없다.[28] 대표적인 예로 동영상 코딩을 하는 경우 전용 하드웨어 가속기인 ASIC은 성능과 전력 효율은 최고지만 동영상 코딩 그 외의 작업은 하는 것이 불가능하다. (고성능+ 저전력+ 유연성-) 그에 비해 CPU와 같은 범용 프로세서를 ASIC 급으로 동작시키기 위해서는 클럭을 높이거나 탑재 트랜지스터를 늘리지만 그와 비례해 물리적인 트랜지스터의 증가로 소비전력이 높아지게 된다. (고성능+ 저전력- 유연성+) 그리고 다시 여기서 소비전력을 낮추기 위해서는 트랜지스터의 수를 낮추거나 클럭을 낮추는 등의 방법을 사용하면 성능을 희생해야만 하는 것이 그 예이다. (고성능- 저전력+ 유연성+) 이러한 이유 때문에 개념을 혼동하여 간혹 특정 프로세서의 성능이 과대평가 되는 경우가 있는데 8K HEVC HIGH10 422 영상을 디코딩하는 시나리오에서 하드웨어 가속기가 탑재된 저전력 SoC와 64코어의 AMD Ryzen Threadripper 3990X는 동일한 재생 성능을 보여 준다는 단편적인 것 하나만으로 두 프로세서의 성능이 같다고 보기 어려운 것이 그 예이다. 기본적으로 실리콘 면적과 성능은 비례하고, 성능과 전력은 반비례한다. ARM 계열 마이크로아키텍처는 저전력/고성능은 달성 가능하지만 유연성이 부족하고, AMD64 계열 마이크로아키텍처는 고성능/유연성은 달성 가능하지만, 저전력을 구현하기 어렵다.ARM 계열 마이크로아키텍처는 지금까지 저전력이란 목표를 먼저 설정하고 성능을 구현하는 방식으로 저전력/고성능을 추구해왔으나, Cortex-A15에서 한계에 부딪혔다. 이후 저전력 + 고성능 하이브리드 코어 구성방식인 ARM big.LITTLE 솔루션을 도입한 상황이다.[29] 폴락의 법칙으로 인해 고성능은 다이의 크기와 비례하므로 성능을 높이면 전력소모가 늘어날 수밖에 없으며, ARM 계열 마이크로아키텍처라고 뾰족한 방법이 있는 것은 아니다.
ARM 프로세서의 성능이 비약적으로 향상된 것은 사실이지만, 일부에서 주장하는 것처럼 x86을 대체한다던가 서버 시장을 휘어잡을 것이라는 예상은 현실과 거리가 멀다. 최근 들어 주요 대기업들이 ARM과의 호환성을 늘리는 작업을 진행 중이기는 하지만, 이는 x86 진영이 흔들리는 것이 아니라 플랫폼의 확장 개념으로 받아들여야 한다. 현재 PC와 서버 시장을 장악하고 있는 x86 계열 마이크로아키텍처는 일반적인 인상과는 달리 고성능이 아니며[30] 전력대 성능비도 나쁘지만[31], 매우 뛰어난 유연성과 적당한 성능, 비교적 저렴한 가격 대가 경쟁 우위이다.
- ARM Holdings의 문제
x86 진영에 비해 arm 전문 개발 기업이 ARM Holdings밖에 없다는 문제가 있다. 엔비디아와 인수 얘기가 있던 시절에도 x86에 비해 개발력이 떨어진다는 점을 호소했었다. 특히 R&D 부분에서 매우 취약한 탓에 NVIDIA가 인수한다면 큰 도움을 줄 거라 기대했으나 각국 정부의 반대로 불발됐다. 2023년 기준 IPO 상장 준비중이다.
인수에 반대하는 영국 규제기관에서 Apple의 Apple Silicon이나 Qualcomm처럼 ARM의 대표적인 성공 사례가 아니냐고 추정했지만 정작 ARM Holdings는 Apple과 Qualcomm의 아키텍처 라이센싱 및 커스텀칩은 자사 CPU 설계를 전혀 쓰지 않고 독자적인 CPU 설계를 사용한다고 반박했다.[32] 결론적으로 ARM Holdings가 해당 회사들과 경쟁해야 할 실정이라고 했으니 말 다한 셈이다.[33][34]
결정적으로 개발 인력이 계속해서 유출되고 있고 특히 ARM 차이나 사태 때문에 중국이 기술과 노하우를 몽땅 훔쳐가는 바람에 내부 상황이 개판이라고 한다.# 물론 중국이 정부 차원에서 대놓고 훔친 것에 대해 큰 비판을 받겠지만, 해당 사태를 방관하고 이렇다 할 대책은 커녕 NVIDA의 ARM 인수에만 신경 쓰는 영국 정부에게도 책임이 있다. 매우 모순적이게도 영국은 국가 안보에 중요하다면서 미국 기업인 NVIDIA의 인수를 반대하고 있는데 정작 중국이 ARM 기술 및 노하우와 중국내 매출을 훔칠 땐 아무것도 안 하고 있었다.
결국 ARM Holdings는 종합적으로 개발능력이 크게 약화한 탓에 레퍼런스 모델을 그대로 쓰긴 커녕 몇몇 회사들은 Apple처럼 이미 커스텀칩을 개발해야 할 실정이라 NVIDIA의 도움이 무척 절실하다. R&D 부분에서 강력한 Intel에 매우 밀리는 상황이고 RISC-V라는 새로운 경쟁자까지 등장했다. 이와중에 개발 인력들이 많이 유출되고 자본까지 부족한 탓에 NVIDIA에 인수가 안된다는 건 앞으로 AMD64랑 경쟁은 커녕 살아남기 힘들 수밖에 없다. 그래서 자신들의 과거의 명성을 낭만적으로만 보지 말라고 반박했던 것이다.
- 호환성과 그에 따른 유연성
x86 계열 마이크로아키텍처를 사용한 플랫폼의 경우 가격 대비 성능비가 매우 뛰어나며, 유연성 측면에서는 안되는 것이 없다고 할 정도로 타 ISA인 마이크로아키텍처 대비 압도적이다. x86은 소프트웨어 및 하위 호환성에 극단적으로 신경쓰기 때문에 인텔이든 AMD든 소프트웨어 단위에서는 거의 100% 호환된다. 이런 측면에서 ARM 프로세서와 대비되는데, 같은 Cortex A 시리즈 마이크로아키텍처를 쓴다고 해도 x86의 호환성은 결코 넘볼 수 없는 부분이다. 당장 인텔 시스템에선 잘 돌아가던 프로그램은 AMD시스템에서 돌려도 똑같이 잘 돌아가며, 애초에 두 시스템간의 드라이버 이슈만 해결해주면 두 시스템을 스왑해도 이론상 모든 프로그램이 잘 동작한다.
그에 비해 ARM의 경우 근본적으로 범용 컴퓨터 보다는 임베디드와 같이 특정 기기에 한정해 사용되는 경우가 주 용도였다 보니 제조사의 커스텀이 심하게 들어가게 되며 하드웨어 제조사가 SoC에 ASIC을 추가한다고 해도 이러한 가속 기능을 소프트웨어에서 사용하기 위한 인터페이스 부터가 하드웨어 제조사와 소프트웨어의 긴밀한 협업이 없으면 사실상 불가능한 수준이다.
극단적으로 말해서 ARM 프로세서는 제조사에서 명시적으로 된다고 발표한 기능 이외에는 모두 안된다고 보면 된다. 특히 임베디드 미디어 플레이어들의 경우 프로세서의 낮은 성능을 뒷받침하기 위해 ASIC에 의존하는 데다 특정 하드웨어 에서만 사용되는 경향이 높다 보니 소프트웨어 레벨에서도 이를 전부 수용할 수 있는 통일된 인터페이스가 사실상 없다시피 하다.
위의 호환성 내용의 연장선으로 특히 임베디드 미디어 플레이어들의 경우 프로세서의 낮은 성능을 뒷받침하기 위해 각종 멀티미디어와 같은 기능을 처리하기 위해 ASIC에 의존하는 경향이 높다 보니 더더욱 그런 경향이 심한 편 인데 유연성이 떨어지는 ASIC의 특성상 영상의 코덱이 비트퍼펙트 하더라도 컨테이너가 바뀐 비트스트림이 변형된 상황에서는 대응이 불가능 하다는 것이 문제다 보니 단순히 ARM으로 네이티브 하게 프로그램을 작성한다 한들 타 기기에서 그 코드가 같은 성능으로 동작한다는 보증이 불가능하다.
특히 이런 문제가 극대화된 경우로 x86 플랫폼 시장은 BIOS와 UEFI를 통한 부트스트랩 표준이 잡혀 있어 범용적으로 운용이 가능한 것에 비해 ARM은 임베디드와 같이 스태틱 부트스트랩만이 가능한 제품들만이 시장에 나와 있다. 그나마 가장 쉽게 접근이 가능한 ARM 디바이스인 라즈베리 파이조차도 UEFI와 같은 기능을 가진 범용 펌웨어 규격이 사용되지 않고 독자적인 부트로더를 사용하다 보니 특정 하드웨어를 위해 만든 소프트웨어 이미지를 다른 ARM 디바이스에 콜드부팅하는 것 부터 불가능하다.
- 프로그래밍
인텔이든 AMD든 x86 계열 마이크로아키텍처를 채용한 프로세서는 CISC 명령어를 내부적으로 RISC 명령어로 변환하는 과정을 거쳐서 실행되는 비효율적 구조를 가지고 있다. ARM 프로세서는 RISC 명령어로 직접 작성되므로 x86 프로세서보다 훨씬 효율적일 것 같지만 현실은 오히려 반대이다. 프로그래밍의 효율성 측면에서 x86 프로세서가 ARM 프로세서 보다 훨씬 뛰어나다. 컴퓨터에게 일을 시키려면 프로그래머가 프로그램을 짜야하는데, CISC 계열이라면 한 개의 명령어(Complex Instruction)로 처리 가능한 것이 RISC 계열에서는 단순하지만 몇 개의 명령어(Micro-Opertions, µOPs)를 조합해야만 한다. 프로세서 구조는 RISC 쪽이 효율적이지만, 정작 그 프로세서를 다루는 코드를 작성하는 작업은 CISC 쪽이 더 효율적인 것이다.
우수한 프로그래머가 많다면 RISC 쪽이 더 효율적이 되겠지만, 세상 프로그래머의 대부분은 그렇게 우수하지 못한 것이 현실이다. 디자이너의 필수품인 어도비 포토샵은 발적화의 대명사에 꼽힐 정도로 비효율적인 프로그램이며, 게임의 경우도 멀티 코어 시스템에서도 코어 분배를 거의 않고 싱글 코어만 죽어라 갈구는 경우가 많다. 유명 소프트웨어 기업에게도 최적화 프로그래밍은 어려운 것이다. 현대에 들어 하드웨어 성능이 비약적으로 향상되면서 최적화에 덜 신경 쓰는 분위기이다. 한결 수월하다는 CISC 프로그래밍조차 이런데 RISC 프로그래밍의 최적화 난이도는 말할 것도 없다. 서버 시장에 진입하려는 ARM 프로세서의 가장 커다란 장벽 중의 하나가 바로 개발 도구 부족인데, x86 진영과 비교하면 서버에 특정 기능을 구현하는 프로그래밍용 개발 도구 자체가 없다시피하는 수준이다. - 지나친 커스텀으로 인한 파편화 문제, 이에 따른 호환성 저하
ARM계열이 AMD64진영을 대체하기 어려운 가장 큰 이유다. ARM 계열은 지나친 커스텀으로 인해 OS 개발자들의 선호도가 떨어진다. 리누스 토르발스 또한 ARM을 보면 골치 아파진다고 토로했으며, # 명령어 세트(RISC, CISC 등) 같은걸 따지는 것 보다, 호환성, 표준화, 지원여부가 더 중요하다면서 x86 계열은 이게 더 잘되어 있어 ARM보다 우월하다고 했으며, 개인적으로 ARM에 대해 실망했다고 밝혔다.#[35]
그 예로 Apple 의 M1만 하더라도 32비트 환경인 AArch32를 지원하지 않는다. 이 때문에 watchOS와 같은 저성능 임베디드 장치에선 RISC 특성상 32비트 대비 64비트 사용시 요구 메모리와 코드사이즈가 증가하기에 AArch64에서 32비트의 포인터 사이즈를 사용하는 AArch64_32 ILP32 변종을 사용하고 있다. 물론 이 구동 환경은 ARM Holdings의 표준이 아닌 Apple의 독자 비표준 구현이다. 다만 M1은 Apple만이 자사의 생태계에서만 사용하기 때문에 그런 호환성 문제가 문제되지 않을 뿐. 반대로 AMD64의 예를 보자. 인텔에서 자사의 x86 계열 CPU에 최적화된 Linux인 인텔 클리어 Linux를 배포하는데, 이걸 AMD CPU에서 돌려도 완벽하게 호환되는 것은 물론 엄청난 성능 향상이 있다.#
인텔과 AMD만 있던 x86과는 달리, ARM은 삼성, 퀄컴, MediaTek, AMD, 구글 등등 최소 6~7곳에서 ARM칩을 개발 중이기 때문에 어느 정도의 최적화 및 파편화 문제는 있을 수밖에 없다. Linux의 배포판 문제는 각각의 철학에 의한 소프트웨어 스택 차이에서 생기는 문제이지 하드웨어에서 발생하는 파편화 문제가 아니기 때문. 이미 라즈베리파이에서 돌아가는 배포판만 보더라도 Raspberry Pi OS, Ubuntu, Elementary OS, CentOS, Arch, Gentoo openSUSE 등등 상황은 똑같다.
이런 하드웨어 레벨의 커스터마이징에 따른 소프트웨어적 문제는 이미 Lexra[36]의 MIPS 프로세서가 대표적으로 일부 명령어의 누락으로 인해[37] 전용 SDK와 소프트웨어 스택으로만 구현해야 했으며 이 때문에 다른 MIPS프로세서와의 상호 호환성 문제가 대표적이며, 스코프를 ARM으로만 줄여도 NVIDIA Tegra와 다른 표준 ARM 레퍼런스 프로세서와의 호환성 차이를 꼽을 수 있다. - Vendor 부재로 인한 낮은 접근성
ARM 진영은 서버를 만들어서 공급해줄 벤더(Vendor), 즉 셀러(Seller)도 없다. 서버 시장은 단순히 CPU를 판매하는 시장이 아니다. 벤더는 CPU와 메모리, 메인보드, 저장매체를 포함한 기타 하드웨어 일체와 OS와 관련 소프트웨어, 유지보수, 기술지원 서비스 등을 패키지로 묶어서 판매하는 것이다. 상기 문단에서 이야기한 바와 같이 하드웨어, OS, 파편화 문제 등으로 인해 델, HPE, Inspur, Lenovo 등의 주요 서버 업체는 ARM 서버를 공급하지 않고 있으며, ARM 아키텍처의 전성비가 아무리 뛰어나도 만들어서 팔아줄 벤더가 없는 것은 치명적인 결함이다. 최근 아마존·MS·구글이 데이터센터 칩 자체 개발을 선언하면서 ARM 프로세서가 서버시장으로 영역을 넓힐 것이라고 착각하는 사람들이 있지만, 애초에 이들 업체는 세계 클라우드 서비스 1/2/3위 업체들로 자사 서비스를 위한 칩을 개발하는 것이다. 대형 ITC들은 하드웨어/소프트웨어 모두 자체적으로 개발할 자본/역량/기술을 가졌기때문에 가능한 것이며, 기타 업체들은 여전히 벤더에 의존해야만 한다. 더욱이 Linux가 서버 시장을 석권한 상태이므로 x86 서버 관리/서비스 인력은 넘쳐나지만, 파편화 된 ARM 관련 인력은 찾아보기 힘들다. 물건을 살 벤더도 없는데 그걸 관리할 인력은 더 부족한 것이다.
소비자 시장도 별 차이가 없는데, ARM 칩을 사용한 컴퓨터는 Apple Silicon Mac을 제외하면 MS, 퀄컴, 삼성에서 시험삼아 출시한 노트북 몇 종이 전부이며, 판매하는 셀러도 찾아보기 힘들다. MS 서피스 프로 X 같은 경우는 미국보다 국내 출시가 반년 이상 늦어지면서 미국에서 직구해야만 구입 할 수 있었을 정도. 메이커 기술지원은 사실상 불가능한 수준이고, 사용자가 적어서 유저 커뮤니티의 도움도 받기 어려워서 문제가 발생하면 해결할 방법도 없다.[38]
과거 DEC Alpha, MIPS, SPARC, IA-64같이 x86 보다 우월한 프로세서들은 많았지만 이 제품들은 주로 B2B로 공급되어 결과적으로 통제된 제품만이 생산되었고 최종 사용자들은 이렇게 만들어진 완제품만을 공급받게 되었다.
그에 비해 x86은 리테일 환경에서도 프로세서와 그 주변 장치들을 제한 없이 구매할 수 있으며 이런 넓은 접근성은 프로그래머가 개발하는 환경이 되고 이렇게 만들어진 프로그램들과 하드웨어는 그 즉시 서버로도 전환이 가능해 결과적으로 가장 큰 하드웨어와 소프트웨어 생태계를 가지게 되었으며 이 점은 ARM도 여전히 극복하지 못한 상태다. Apple과 Amazon은 인하우스로 직접 쓰고 있기에 개인 사용자가 접근할 여지가 없고 Ampere 프로세서의 경우도 리테일에서 쉽게 구매할수 있는 제품이 아니다.
x86의 기계어는 생각보다 깔끔한 편이다. 일부 비효율적인 부분이 존재하기는 하지만 바이트 단위로 떨어지게 되어있기 때문에 즉시값을 제외한 모든 기계어 코드가 바이트 단위로 읽게 되어있다. RISC의 경우 무조건 효율성이기 때문에 난해한 부분들이 많다. 예를 들어 x86은 연산 범위를 초과하지 않는 한 대부분의 값들은 바로 더할 수 있다. 하지만 RISC는 일정 이상의 값이 넘어갈 경우 다른 명령어들의 조합으로 해결해야 한다. 그리고 이 한계치는 명령어 집합 구조에 따라 다르다. 그래서 컴파일러 설계 복잡도가 높아지게 된다. 이미 이론적으로 극한의 효율성을 보여주는 VLIW를 사용한 인텔 아이태니엄 프로세서의 구현된 실물은 사용의 난해함 때문에 널리 사용되지도 못 했다.
어셈블리어 프로그래밍으로 가면 명령어 집합보다는 컴퓨터에 대한 이해도를 더 필요로 하기 때문에 어떤 CPU가 더 프로그래밍 하기에 쉬운지 정의할 수 없다. 특히 이러한 명령어 레벨의 최적화는 바닥부터 어셈블리로 코딩하는게 아닌 이상 컴파일러의 능력에 달렸다.
참고로 전력대 성능비를 보면 전용 IC > GPU > CPU 순서이다. 인텔 동영상 디코딩/인코딩 유닛인 QSV가 전력당 성능비가 좋은 이유도 동영상을 처리하기 위한 기능을 하드웨어적으로 내장했기 때문이다. 이러한 현상은 현행 제품들에서도 보이는데 x86 아키텍처 기반 프로세서들은 한없이 CPU에 가까운 구조이고, ARM 아키텍처 기반 프로세서들은 전용 IC와 GPU 중간쯤 되며, 범용 유닛과는 거리가 멀다. 애초에 ARM 아키텍처를 사용한 제품들은 목표 전력을 먼저 설정해놓고 기능을 구현하는 형태이며, 부족한 성능을 전용하드웨어 유닛을 추가하여 보완하는 구조이기 때문이다. ARM 아키텍처의 변천사를 보면 저전력을 기본으로 시장에서 요구되는 여러가지 기능들을 지속적으로 추가시켜 온 것을 알 수 있다.
ARM(CPU)는 전력당 성능비를 앞세워서 영역을 넓혀오다가, 주류 시장 진입을 노리면서 비순차 명령어처리나 L2 캐시 같은 성능 중시 기술을 도입한 것이다. 엄밀히 말하면 ARM 아키텍처는 범용 아키텍처가 아니며, 전용 IC에 가까운 형태였던 CPU가 여러가지 기능을 추가하고, 시장을 넓히면서 점차 범용 아키텍처화 되고 있는 것이다. 그리고 그 결과의 산물이 Cortex-A15인데 범용 마이크로아키텍처화되면서 저전력이란 장점을 잃어버렸다. 최근 발표 된 Armv9 기반의 Cortex X2, A710, A510는 저전력 환경에서 성능 차이가 크지 않으며 전력 소모가 높아지면 성능 차이가 커진다.# 따라서 미세 공정이 적용되지 않으면 전성비는 향상되지 않는다.
2023년 6월, 애플에서 기존 인텔 CPU 대신 자사의 애플 실리콘을 장착한 2023년형 맥 프로를 발표했는데, 확장성뿐만 아니라 기초적인 성능에 있어서도 워크스테이션이라고 하기에는 너무나 민망한 수준으로 큰 비판을 받고 있다. 해당 문서에 자세히 서술된 성능상의 뒤떨어지는 점만 봐도 알겠지만, ARM 계열 프로세서의 근본적 한계라고 할 수 있다.
5. 관련 문서
[1] 64비트 모드인 롱 모드에서는 이러한 16비트 시절 명령어들은 Illegal instruction 오류를 내며 아예 동작하지도 않는다. 이 때문에 현 AMD64 규격에서 레거시 관련 부분을 애플의 ARM 프로세서가 AArch32부분을 제거한 것 처럼 실리콘레벨에서 제거하는 X86-S가 제안된 적이 있으나 2010년대 후반의 CPU 게이트, 2020년대 초반의 13, 14세대 제품 결함, 15세대 성능 부진 등을 연달아 겪으며 인텔이라는 기업의 존재 자체에 위기가 닥친 상황인지라 사실상 인텔이 단독으로 추진하고 있던 본 안건에 대해 신경쓸 여유가 없어졌고 2024년 12월 기준 폐기된 것으로 알려져 있다.[2] 당시 시대적 한계로 인해 만들어졌던 메모리 세그먼트 (address := segment+offset)같은 모델은 현대 컴퓨팅에서는 비효율적이고 더러운 모습이지만 AMD64에서는 그런 모델은 사용되지도 않고 지원하지도 않는 것이 그 예이다.[3] 이런 심각한 파편화 때문에 시중엔 v8.4, v8.5, v8.6 를 사용한 ARM CPU는 출시도 안됐지만 v9까지 발표되었다. 이 때문에 ARM Holdings에선 v9에 v8.6 까지의 명령어를 구현하겠다고 선언한 상태다.[4] Power Struggles: Revisiting the RISC vs. CISC Debate on Contemporary ARM and x86 Architectures[5] AVX10에 포함되지만 현재 개인 사용자용으로 AVX512를 지원하는 AMD ZEN4에는 없는 유일한 세트[6] 특히, 2019년 8월부터 플레이 스토어에서 64비트 지원이 의무화 되면서, 유니티 엔진의 x86_64 미지원 때문에 업데이트 과정에서 x86을 통째로 미지원하게 된 게임도 많다.[7] Mac mini의 폼팩터를 사용했다.[8] 슈퍼컴퓨터는 근본적으로 돈을 얼마나 퍼붓느냐의 경쟁에 가깝긴 하다.[9] 서피스 프로 X (2020)과 M1 둘다 비슷한 시기에 나왔다.[10] 애플이 후발주자이고 이마저도 칩 전문회사도 아닌데 인텔이 뒤쳐졌다고 한탄한 셈이다. 애플을 라이프 스타일회사라고 비아냥거렸지만 애플이 다른 회사를 대하는 태도에 비하면..[11] 이미 자사 노트북중에서 라이젠을 탑재한 제품이 존재한다.[12] 다만 인텔이 보도자료로 여러 번 사기친 전적이 있어서 대놓고 믿으면 안된다. 당장 해당 자료에서 쓰인 모바일 CPU는 TDP 28W급인 1185G7을 썼고 발열이나 전력소모량에 대해선 아무런 언급조차 안 했다. M1칩은 인텔 모바일 CPU Y 시리즈보다 더 낮은 발열량과 전력소모량을 가지고 있기에 애초에 비교 자체가 이상한것이다.[13] i9-10875H는 TDP만 45W로 M1보다 훨씬 더 높은 발열량과 전력소모량을 가지고 있으며 외장 그래픽카드까지 탑재했으니 실질적인 체급 차이는 매우 크다할 수 있다.[14] 그럴 것이 ARM칩을 쓰는 회사중 그래픽 성능이 높은건 애플밖에 없다. 애플은 독자적으로 개발해서 쓰고 있지만 타회사들은 ARM 레퍼런스 모델을 그대로 쓰거니와 애플처럼 개발하려고 했다가 죄다 포기한 상태다. 격차가 크다보니 기존 그래픽카드 회사들인 AMD와 엔비디아에게 도움을 얻는걸로 보인다.[15] 실제로 애플쪽에서 불만을 토로했었다.[16] 하지만 지금조차 M1에 버금가는 ARM칩이 단 하나도 없기에 ARM 참여률은 당분간은 낮을 수밖에 없다.[17] 차이점이라면 애플은 모바일앱이라도 맥 환경에 맞춰서 최적화 해줘야 한다는 것이고 Microsoft는 모바일앱을 아무런 최적화 및 수정없이 그대로 사용해준다는 것이다. 원래는 사이드로딩이라고 해서 애플도 모바일앱을 우회해서 그대로 사용할 수 있었지만 애플이 보안문제를 거론하면서 막아놓았다.[18] 그래픽카드는 3060이다.[19] 게임의 경우, 대다수 게임들이 Windows 기반이기 때문에 최적화 수준에서 많이 뒤쳐진다. 애초에 Metal API는 오로지 애플만 쓰기 때문에 최적화 난이도가 높으며 이마저도 macOS의 수익률이 낮기 때문에 개발자 및 개발사들이 제대로 지원하지 않는 것도 한몫하고 있다.[20] 다만 전력제한이 없는 데스크탑 다이로 테스트했고 모바일 다이는 전혀 다르기에 명확한 실험은 아니며 결정적으로 애플 실리콘은 시네벤치에 제대로 최적화되지 않았다. 오히려 인텔기반 명령어를 쓰기 때문에 인텔이 더 유리할 수밖에 없다.[21] 또한 전력소모량은 30W가 아닌 여전히 45W로 최대 30W까지 사용하는 M1 Pro/Max에 비해 50% 이상의 전력소모량을 가지고 있다.[22] 다만 Rosetta 2같은 번역기가 없어서 기존 x86 소프트웨어들을 사용할 수 없어서 실질적으로 사용하기 힘들다는 점, Apple Silicon맥에 비해 지원되는 소프트웨어 갯수가 매우 적다는 점, 그리고 결정적으로 Apple외엔 강력한 칩을 만들 수 있는 회사가 사실상 없다는 점으로 인해 넘어야할 산들이 많다.[23] 사실 x86계열 프로세서의 소비전력은 CISC라는 ISA와 이를 해석하는 디코더의 문제가 아님을 증명하는 연구가 있다.[24] 하지만 기존 인텔과 AMD만 해도 CPU 관련 업데이트를 많이 했어야 하는데 삼성, 퀄컴, MediaTek, 기타등등 무수히 많은 회사들이 참여하는 것은 차원이 다른 얘기다.[25] 이는 Apple A13과 A14의 성능향상폭인 21%보다 더 크다![26] 컴파일러가 자동으로 해 주는 SIMD와 같은 벡터 명령어 최적화는 인간이 우수하다.[27] 이미 테슬라가 최적화 이유로 엔비디아를 버리고 독자적인 ARM칩을 개발한 사례가 있다.[28] 경제학에서 불가능의 삼각정리와 유사하다.[29] ARM 빅리틀은 저전력 4코어+고성능 8코어 조합이다. 인텔 레이크필드도 저전력 4코어+고성능 1코어 조합을 채택했다.[30] 종합 성능에서는 IBM POWER보다 많이 뒤쳐지며, 특정 연산 성능 한정이라면 GPU에게 추월당한지 오래됐다.[31] ARM 프로세서에 모바일 시장을 뺏긴 이유이다.[32] The filing also disputes U.K. regulator’s assumption that licensees such as Apple and Qualcomm demonstrate Arm’s ongoing success. To the contrary, it notes, “Architectural licensees do not use Arm’s CPU designs. Arm architectural licensees create their own proprietary CPU designs using their own engineering teams in the United States.[33] M1만 해도 Apple이 모두 설계했지 ARM은 전혀 관여조차 안 했다고 언급했다. 그저 ARM의 명령어셋만 이용할 뿐이다.[34] Amazon이나 Ampere에서 만드는 데이터 센터용 ARM 칩 모두 커스텀칩이다.[35] 다만 토발즈가 ARM 자체를 싫어하는 건 아니다. 그는 항상 노트북급 성능을 가지는 ARM 시피유가 있었으면 좋겠다고 했으며, 실제로 Apple에서 x86 대신 ARM을 넣은 맥을 발표하자, 해당 소식에 기뻐했다. #[36] 리얼텍이 인수. 그 때문에 리얼텍의 MIPS 프로세서와 SoC들은 Lexra-MIPS 아키텍처가 사용된다.[37] Lexra MIPS의 라이센스와 특허 문제로 인해 몇가지 명령어의 구현을 생략했다[38] 다만 퀄컴 때문에 ARM 버전의 Windows 11을 애플을 포함해서 다른 회사들이 사용하지 못하는 상황이기 때문에 당연하지만 셀러가 없을 수밖에 없다.