나무모에 미러 (일반/어두운 화면)
최근 수정 시각 : 2025-01-19 16:47:06

AMD64 vs ARM


명령어 집합
CISC AMD64x86 · M68K · 68xx · Z80 · 8080 · MOS 65xx · VAX
RISC AArch64 ARM · RISC-V · MIPS · DEC Alpha · POWER PowerPC · CELL-BE
LoongArch · OpenRISC · PA-RISC · SPARC · Blackfin · SuperH · AVR32 AVR
VLIW
EPIC
E2K · IA-64 · Crusoe


1. 개요2. 각 아키텍처의 특징3. 역사
3.1. 1980년 ~ 2009년3.2. 2010년대3.3. 2020년대
4. 전망
4.1. ARM 우세4.2. x86 우세
5. 관련 문서
파일:AMD64 로고.svg vs 파일:ARM powered Badge.svg

1. 개요

AMD64ARM의 성능 비교를 위한 문서다.

2. 각 아키텍처의 특징

2.1. AMD64

원래는 1999년에 x86구조를 유지하면서 64비트를 지원하도록 설계된 아키텍처였다. 16비트, 32비트를 넘어 64비트까지 오게된 것. 컴퓨터 역사상 유례없는 대확장이 두번이나 이뤄졌지만 하위 호환성으로 인해 구조가 복잡하다고 말하지는 않는다. 일부 구시대의 잔재가 사라졌지만 그것은 지금 시점에서는 크게 의미를 가지지 않기 때문에 명령어 구조에서는 예나 지금이나 거의 비슷하다.

ISA의 특징이라면 일단 CISC이며 IA-16부터 확장되어 온 만큼 구조가 난잡하다. 여러 분야에서 쓰였기 때문인지 다양한 명령어를 지원한다. 그러나 이 사실은 어느 정도 회의적인 것이 지금은 AMD64 시대이고 더이상 레거시 명령어를 사용하지 않는다.[1] 레거시 명령어들을 생각하고 바라본다면 복잡한건 맞지만 그런 부분을 제외한다면 AMD64는 충분히 잘 설계된 명령어 체계인 것이다.[2]

인텔의 8비트 CPU들과 호환성을 가지기 위해 상태 레지스터의 첫번째 바이트는 인텔 8080의 것과 완전히 동일하다. 또한 누산기를 중심으로 사용했던 흔적이 남아있는데 AX 레지스터 전용의 명령어들이 존재한다. 예를 들어 곱셈, 나눗셈 명령과 입출력 명령어는 누산기에서만 실행이 가능하다. 이 내용들은 AMD64에 들어와서도 여전히 해결되지 않았거나 유지되고 있다.

소수점 연산을 위한 x87 명령어 집합은 x86의 성능 향상을 더디게 만들었는데 8레벨의 스택을 가지고 있고 누산기 구조를 사용하고 있다. 다만 AMD64 프로세서의 x87 지원은 단순 하위호환을 위한 지원이고 SSE를 통해 FP연산을 하는 경우가 대부분이고 컴파일러들 또한 일부러 x87명령어를 사용하도록 옵션을 거는게 아닌 이상 SSE를 통한 연산을 수행한다. x87 나눗셈 연산인 FDIV의 경우 젠3의 경우 15사이클 소모되지만 DIVPS의 경우 10사이클만 소모한다. AArch64의 FDIV의 경우 7에서 17사이클.

32비트에서는 더 많은 기능을 지원하기 위해 주소 지정 모드를 변경했지만 역할만 약간 바뀌었을 뿐 달라진 점은 거의 없다. 이는 AMD64의 기반이 되었다.

64비트에서는 더 많은 레지스터와 메모리 공간을 지원하기 위해 일부 명령어들이 삭제되고 대신 다른 역할이 분배되었다. 기존의 32비트 명령어들과 구분하기 위해 명령어 앞에 접두사(REX Prefix)가 붙는 것으로 해결했기 때문에 32비트 명령어와 크게 차이나지 않는다 대신 접두사로 인해 같은 기능을 하는 32비트 코드보다 바이너리 크기가 더 증가했다.

AMD64의 가장 큰 장점은 호환성과 단일화라고 볼 수 있다. AMD64 기반 CPU를 설계하는 회사는 사실상 AMD와 인텔밖에 없어 단일화가 잘 되어 있고 SIMD(SSE, AVX, AVX512)나 가상화(VT-x나 AMD-v)와 같은 일부 기능들을 빼면 파편화가 적다. 반면 ARM의 경우 상당 부분 제조사의 커스텀이 자유롭기 때문에 Apple 같은 특이 케이스가 아닌 이상 파편화가 심각한 문제점으로 꼽힌다.

2.2. ARM(AArch64)

ARM은 RISC 철학에 따라 엄격하게 저전력 고효율로 설계된 CPU였기 때문에 고효율은 맞지만 고성능을 의미하지 않았다.

엄격하게 고효율성을 생각해서 명령어 집합 구조는 동시대의 다른 CPU들과 거리가 멀다. 그러나 이는 ARMv8 이전의 이야기로 이후로는 다른 RISC CPU들과 큰 차이를 보이지 않게 되었다.

그로 인해 명령어 집합 구조가 크게 바뀌게 되었으며 어셈블리어 구조부터 호환이 되지 않는다. AMD64의 경우 x86은 개인용 컴퓨터 시장이 주류였기 때문에 어셈블리어의 필요성이 높지 않았다. 하지만 ARM은 임베디드가 주 목적으로 C언어보다 어셈블리어가 많이 쓰인다. 그러나 지금은 소프트웨어 규모가 커졌기 때문에 크게 문제될 내용은 아니다.

그래서 두 프로세서의 성능 자체를 비교하는 것은 적절한 비교 방법이 아니다. 각자의 설계 철학, 이념에 따라 갈리기 때문에 한쪽의 일방적인 승리가 아닌 비슷하게 흘러갈 것이다.

ARM의 가장 큰 문제는 파편화이다. x86 계열이 하이퍼바이저 관련 기능 정도만 파편화 되어 있는 것에 비해 (AMD-V, VT-x) 32비트의 IA-32, 64비트의 AMD64만 존재하며 프로세서의 확장 기능 또한 SSE, AVX는 스펙상에 존재하기에 동일한 바이너리 코드가 벤더간 동작에 있어 별다른 문제 없이 호환이 가능한 것에 비해 ARM은 기본 명령어 세트부터 ARM v6/v7/v8/v8-M/v8.1-A/v8.2-A/v8.3-A/v8.4-A/v8.5-A/v8.6-A/v9[3], Thumb1/2/EE, Jazelle, NVIC, VIC, GIC v2/v3/v4 등으로 나뉘어 있는데다 확장 기능도 NEON, SVE, DSP, VFP 등으로 쪼개져 있어 삼성이나 퀄컴이나 모두 똑같은 ARM이지만 기본적인 호환성만 가질 뿐 완전히 다른 CPU라 봐도 무방해 바이너리 코드가 다른 프로세서에서 정상적으로 동작할 것이라는 보장을 할 수가 없고 이는 임베디드용 프로세서도 크게 다르지 않다. 앞으로 ARM이 해결해야 할 큰 문제이고 AMD64와의 경쟁에서 유리한 점은 아니라는 것이다. Apple은 다른 방법으로 해결했는데 아예 폐쇄적인 플랫폼을 만들어서 호환성 문제를 없애고 극한의 최적화가 가능하게 했다. 그 이유는 Apple의 DarwinApple의 칩에서만 구동되기 때문이다. 이 문제 때문에 리누스 토르발스는 ARM보다 x86이 더 낫다면서 ARM에게 실망했다고 발언했다.#

2.3. 비교

x86은 고성능용, ARM은 저전력 고효율용으로 설계된 것은 맞지만 실제로는 기본적인 명령어 집합이 성능에 영향을 끼치는 것은 제한적이다. 이것에 관해서는 관련 연구가 존재한다.[4] 명령어 집합구조(ISA)가 마이크로아키텍처의 설계 및 코어의 성능에 영향을 끼치는 것은 분명하지만 어느 정도의 수준이 되면 마이크로아키텍처 선에서 정리가 될 것이다. 예로 아토믹연산 등에 관한 명령어가 아예 존재하지 않고 락 등을 위한 하드웨어 지원을 발동시킬 명령어 자체가 없는 ISA라면 멀티코어 성능은 그야말로 박살이 날 것이다. 그러나 이정도는 AMD64나 ARM이나 MIPS나 모두 갖추고 있어서 이 부분에 대해선 ISA의 영향력이 크게 떨어진다. 애초에 프로세서의 명령어 구조가 프로세서의 속도에 영향을 크게 미칠 정도였다면 Apple이 사용하는 Rosetta 2 와 같이 백엔드가 어찌 되어 있던 한차례는 AMD64 코드를 디코딩 해야 하는데 그랬었다면 Rosetta 2의 성능이 그만큼 나오지도 못했을 것이다. 애초에 프로세서는 명령어를 받으면 uOp으로 한차례 더 해석되어야 하기 때문이며 이 때문에 마이크로아키텍처 구현 방향이 성능에 더 큰 영향을 주게 된다.

x86 명령어 집합은 AMD64에 들어서 확장이 되었지만 여전히 x86-32에서 정립된 구조를 사용하고 있으며 일부 구시대의 잔재가 사라졌을 뿐 여전히 x86이다. 즉 수십년전의 80386과 명령어 집합이 크게 차이나지 않는다. 반면 ARM은 ARMv8로 넘어오면서 명령어 집합을 완전히 갈아엎었고 그 전의 명령어 집합하고는 아무런 호환성이 없게 되었다. 하지만 ARM의 성능이 크게 개선되지는 않았다.

그러나 x86은 MMX, SSE, AVX를 거치면서 성능이 폭발적으로 증가하게 되었고 ARM도 마찬가지이다. 애플의 칩이 성능이 높은 것이 ARM의 성능이 높다는게 아니라 SIMD 기술이 강하다는 것이다. x86도 SIMD 기술 없이 프로그래밍을 할 수는 있지만 그렇게 되면 게임도 못돌린다. 물론 동영상도 제대로 재생할 수 없고 거의 모든 멀티미디어가 불능이 되어 버린다.

SIMD와 같은 프로세서 확장으로 비교한다면 x86계열이 더 앞서 나가 있는데 SSE/AVX가 단순 벡터 연산 명령어에만 국한되어 있지 않고 유틸리티 연산 명령어가 함께 포함되어 있다. 벡터 연산 끼리만 비교해도 ARM의 Neon이 SSE와 동일한 128비트 크기의 레지스터를 가지고 있는 것에 비해 x86의 AVX-512는 256비트(AMD Zen 4),512비트(인텔, AMD Zen 5이후) 크기의 레지스터를 가지고 있어 동일 클럭 기준 스루풋이 더 높다. ARM쪽도 64비트 ISA인 AArch64 부터 최대 2048비트의 SVE가 옵션으로 존재하나 2048비트는 스펙상에만 구현되어 있고, 실제로 SVE를 사용하는 프로세서는 슈퍼컴퓨터를 위해 만들어진 후지쯔의 A64FX 가 512비트의 SVE 벡터를 지원하는 게 전부이다.

반면 x86의 256비트 연산폭을 가진 AVX는 개인 사용자 레벨에서도 흔하게 보급되어 있고 더 나아가 512비트의 연산폭을 가진 AVX-512는 엔터프라이즈와 하이엔드 제품군에 한정되어 있긴 하나 개인 사용자도 사용이 가능한 것에 비해 ARM 시장은 Neon만이 주력으로 사용되고 있다.

AVX-512제온 파이를 밀기 위한 정신나간 파편화로 리누스 토르발스가 대놓고 극딜하기에 이르렀었고, E코어 문제로 인텔 코어 12~14세대에서 아예 빼버린 문제가 있지만, 역으로 제온 파이가 망한 덕분에(...) 파편화를 수습하기 시작하는 분위기이며, AVX10이 보급된다면 완전히 해결할 예정이라 2024년 현재 시점에서는 AVX2와 (AVX512FP16를 제외[5]한) AVX10 둘만 고려하면 된다.

명령어 집합별로 고유의 특징적 기능들이 존재하는 것은 사실이나 그 영향력이 매우 심하지는 않을 것이다. 또한 명령어 집합의 우수성은 성능만으로 결정되는 것이 아니며 확장성, 코드의 압축성 등 복합적으로 평가되어야 한다.

3. 역사


파일:CC-white.svg 이 문단의 내용 중 전체 또는 일부는
문서의 r638
, 3.4.2번 문단
에서 가져왔습니다. 이전 역사 보러 가기
파일:CC-white.svg 이 문단의 내용 중 전체 또는 일부는 다른 문서에서 가져왔습니다.
[ 펼치기 · 접기 ]
문서의 r638 (이전 역사)
문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

3.1. 1980년 ~ 2009년

1980년대 중반에 처음 ARM이 출시되었다. 그리고 x86과 ARM 양 제품은 PC 시장을 타겟으로 경쟁했고, 이때는 x86의 완승으로 끝났다.

90년대에는 ARM이 PC를 제외한 제품의 SoC 위주로 사업을 영위하게 되면서 영역이 다른 두 제품이 경쟁하는 일은 거의 없었다.

3.2. 2010년대

2010년 초반부터 AMD64 진영의 인텔 측에서 아톰 계열 제품을 필두로 모바일과 태블릿에 적합한 저전력 제품을 개발하려는 노력이 지속되고, ARM 계열 제품도 Cortex-A15에서는 성능 확보에 중점을 두고 개발되면서 양 제품의 전력소모 갭은 거의 없어진 실정이다.

2012년 4월에 출시된 메드필드부터는 ARM과도 충분히 경쟁할 만한 전성비를 보여준다. 결국 전력소모와 성능은 비슷하게 갈 수밖에 없다는 것을 보여주는 좋은 예.

2013년 기준으로 인텔의 신형 아톰 계열 제품인 베이트레일 4코어가 SDP 기준 2W에 터보클럭시의 소비전력 4W, 그리고 성능면에 있어서 기존의 AMD64 코어 아키텍처에 준하는 성능을 보여주면서 전성비와 성능 양쪽 모두에서 괄목할만한 발전을 보여주고 있으며, 실제로도 전성비 상 ARM과 큰 차이를 보이지 않는 상황이고 인텔측에서도 ARM과 대응하기 위해 저가로 프로세서를 공급하고 있으나 아직도 판매량에서는 심히 후달리는 모습을 보여주었다.

2014년 모바일 시장을 타겟으로 하여 설계된 최초의 제품군인 베이트레일 계열 제품이 시장에서 선을 보이기 시작했다.하지만 성능이 기존에 알려진 것보다 뛰어나지 않다. 베이트레일이 채택된 넥서스 플레이어에서의 GeekBench 점수는 ARM의 프리미엄급 제품군 대비 절반 수준에 불과하다. 결국 2014년 동안의 모바일 AP의 성능 경쟁은 Apple-엑시노스-테그라 의 3파전으로 전개되는 양상을 보이게 되었다.

2014년 베이트레일의 발열 문제가 예상했던 것보다 안 좋아 스마트폰용 베이트레일은 출시된 경우가 드물었고 타블렛용 버전인 무어필드 역시 발열 문제를 겪고 있다.

2014년 출하량 4000만 대 목표를 달성하기 위해 주로 중국 화이트박스 업체들을 대상으로 무상에 가까운 가격으로 출시하면서 인텔의 관련 사업부의 적자 규모가 천문학적인 숫자로 불어났다. 그럼에도 불구하고 4000만대 목표 달성이 불투명한 상황. 사실 4000만대 출시에 성공하더라도 전체 모바일 AP SoC 시장의 3%에 불과할 정도의 규모이다. 결국 2014년도 목표치는 2015년도에 4500만 대로 목표를 초과달성한 것으로 확인되었다.

인텔의 14nm 공정 이전이 1년 넘게 지연되면서 베이트레일의 후속작인 체리트레일 역시 2015년 중반으로 1년 정도 지연되었다. 하지만 ARM진영의 탑-티어 업체들은 이미 2014년 말에 14nm 및 20nm 공정으로 제품 양산을 시작하여 공정경쟁에서도 열세에 처하게 되었다. 결론적으로 2014년 기준 모바일 분야에서의 ARM과 AMD64 간의 경쟁은 AMD64의, 특히 인텔의 상식을 벗어나는 행동으로 말미암아 ARM의 부전승으로 끝난 상황이며 AMD64는 전성비나 성능, 경제성 중 어느 하나도 제대로 잡는 데 실패하고 말았다.

2015년 시점에서 몽구스 라는 코드명으로 알려진 엑시노스 8890의 성능 예상치에 세간의 이목이 집중됐다. Apple의 A8 역시 뛰어난 성능을 자랑하며 업계에서의 존재감을 여전히 유지하고 있다.

2015년에 출시한 체리트레일은 22nm에서 14nm로 제조공정이 향상되었는데도 불구하고 클럭이 제자리에 머물면서 성능 경쟁에서 뒤쳐지고 무엇보다 SoC 내에 통합된 주변장치들의 스펙에서도 밀리고 있다. 특히 GPU와 Disk I/O 부분. 모바일 SoC의 라인업을 x3/5/7 시리즈로 명칭을 변경하고 CPU 설계 IP를 중국 락칩사와 공유하여 SoFIA라는 제품군을 신설했다. 해당 제품은 락칩사가 TSMC 28nm 공정을 이용하여 만들 예정.

2015년 1월 6일 CES 2015에서 인텔은 쿼크 SE를 발표했다. ARM의 Cortex-M에 대응되는 제품이며 SE제품의 발표로 인텔은 ARM의 Cortex-A/R/M 라인업에 대응하는 체계를 완성하게 되었다. Cortex-M만 해도 6종의 제품이 출시된 반면 AMD64는 이제 쿼크 SE만 출시했을 뿐이다.

2016년 ARM 진영의 대표주자인 스냅드래곤 820엑시노스 8890 모두 걸출한 성능을 안정적으로 보여주면서 플래그십급 제품으로서의 위상을 확고히 다진 반면 인텔의 x3/5/7 시리즈는 하이엔드 스마트폰 시장으로의 진출에 아예 실패하면서 양자 사이에 성능 경쟁 자체가 성립될 수 없는 상황이 계속 이어졌고 결국 2016년 4월 29일, 인텔이 아톰 모바일 SoC 개발을 중단한다고 밝힘에 따라 인텔은 결국 모바일 SoC 시장에서 사실상 완전히 패배해 버렸다. #

2016년 AMD가 시애틀이라는 서버용 ARM 칩을 출시했지만, 별로 크게 재미는 못 봤다.

2017년 Apple의 A11 Bionic이 전작 A10 Fusion에 비해서도 성능이 비약적으로 증가하면서 긱벤치 상으로 스카이레이크 이후의 AMD64 기반 CPU들에 근접하는 성능을 가지게 되었으며, ARM진영 내에서도 거의 독보적인 성능 지위를 확보하기 시작했다. 특히 ARM 아키텍처의 특성상 전성비가 상당히 높으며 Microsoft의 ARM 프로세서에 대한 Windows 지원 계획이 성공할 경우 AMD64에 대한 분명한 위협이 될 것으로 보인다. 앞으로 SoC 시장에 AMD64가 내려와 경쟁하는 것보다 ARM이 체급을 올려 일반 데스크톱 시장에서 AMD64를 추격하는 모양새가 될 확률이 높다.

2018년 1월에 삼성에서 독자적으로 커스텀한 M3 몽구스 코어를 기반으로 한 엑시노스 9810 이 발표되었다. 출시 전에는 긱벤치 4에서 멀티쓰레드 점수 10000점에 근접하는 등 스냅드래곤을 훨씬 능가하고 Apple의 A11 Bionic과 맞먹는 벤치마크 점수를 선보이며 모두의 기대를 모았지만 실성능은 한심하게 낮은 성능을 보여 실망을 안겼다.

2018년 11월 26일 AWS에서 ARM기반 Graviton 프로세서를 사용하는 EC2 A1 인스턴스를 공개했다.출처영상

2019년 기준으로 몇 년간 루머로 나왔던 ARM을 탑재한 Windows 10macOS가 2020년에 공개된다는 정보가 슬슬 풀리기 시작했는 데 Apple의 경우, 아예 인텔 쪽에서 Apple이 인텔 CPU를 버리고 자사 칩을 2020년부터 탑재할 것이는 기사가 나온 상태다. 게다가 2021년까지 iPadOSmacOS 둘 다 쓸 수 있도록 통합할 계획도 나온 상태다. Microsoft의 경우, 이미 ARM 기반 컴퓨터에서 돌릴 수 있는 Windows 10이 프로토타입으로 나왔고 이쪽도 ARM을 탑재한 Surface Pro X를 발표했다. 그러나 비싼 가격과 낮은 성능으로 컴퓨터 시장에 큰 변화를 가져오진 못 했다. Microsoft의 ARM 기반 Surface의 성능이 부족한 것은, 실시간으로 x86 프로그램을 에뮬레이팅하기 때문이다. ARM 포팅된 프로그램들은 성능 하락 없이 실행된다.

삼성과 퀄컴 모두 커스텀 아키텍처를 포기했다. 퀄컴은 S865에서 커스텀 코어가 아닌 A77+A55를 조합했고 삼성은 자체 코어를 개발하는 몽구스 프로젝트를 해체했다. Apple의 A13 Bionic은 여전히 삼성과 퀄컴 등 경쟁 회사의 프로세서를 훨씬 능가하는 막강한 성능을 자랑하며 ARM 진영 선두주자의 위엄을 유지했다.

유니티구글 플레이 스토어의 64비트 의무화등 때문에 64비트 대응 준비 하면서 사용현황을 검토했더니, 시장에 보급된 x86 기반 Android 기기의 수가 매우 적은 것으로 나타났다. Unity 2019.2부터 x86 기반 Android 지원을 중단하기 시작했다.[6] 유니티 엔진을 사용하는 게임의 사례

2019년 12월 3일 AWS에서 ARM기반 Graviton2 프로세서와 이를 사용하는 EC2 M6g, C6g, R6g 등의 인스턴스를 공개했다.출처영상
아난드텍 리뷰에 따르면 AMD EPYC 7571, intel Xeon Platinum 8259CL과 비교했을 때 절반가량의 TDP에도 불구하고 비슷하거나 뛰어난 성능과 저렴한 가격으로 가성비에서 상당한 우위를 차지한다.

3.3. 2020년대

2020년 6월 11일, AWS는 2019년 12월 3일에 발표한 6세대 EC2 인스턴스를 GA로 전환했다.

2020년 6월 22일, Apple은 WWDC 2020 발표회에서 12.9형 iPad Pro 4세대에 이미 탑재됐던 A12Z Bionic 칩에 RAM을 16GB 확장한 개발자 전환 키트[7]로 macOS를 시연했는데, 여러 개의 4k영상 동시 렌더링이나 5GB의 psd파일을 포토샵에서 끊김 없이 처리해내는 우수한 성능을 보여줬다. Rosetta 2를 통한 x86 에뮬레이팅도 시연했는데 여기서 마야의 렌더링 작업과 쉐도우 오브 더 툼 레이더를 비록 옵션에 타협은 있었지만 1080P해상도에 60프레임으로 구동해냈다. 네이티브가 아니여서 성능이 낮을 수밖에 없는 에뮬레이팅임에도 불구하고 낮지 않은 성능을 보여주었기에 상당히 인상적이다.

2020년 6월 22일, 후지쯔에서 개발한 ARM 기반 슈퍼컴퓨터 후가쿠가 전세계 슈퍼컴퓨터 1위를 차지했다. 해당 슈퍼컴퓨터의 연산성능은 415.5PFLOPS로, 기존 1위였던 IBM POWER 기반 슈퍼컴퓨터의 연산 성능인 148.8PFLOPS의 2배 이상이다.[8]아난드텍 리뷰
단순 연산속도 뿐만 아니라 산업 이용 능력 평가치 HPCG 및 빅데이터 능력 평가 Graph 500, AI성능 평가 HPL-AI 등 모든 부문에서 세계 1위를 차지했으며, 이렇게 한번에 모든 분야에서 세계 1위를 기록한 것은 후가쿠가 처음이다. AppleApple Silicon과 함께 ARM은 x86보다 뒤처진다는 기존 선입견을 박살낸 사례 중 하나이기도 하다.

2020년 11월 11일, Apple은 차세대 MacBook Air, 13형 MacBook Pro, Mac mini 용으로 개발된 M1 칩을 공개했다. 이 칩은 iPhone 12에 탑재된 A14 Bionic 기반으로 만들어졌기에 Firestorm + Icestorm 코어 조합이다. Apple Firestorm은 8-Wide 디코더 구조를 가지는데, 이는 현용 CPU 역사상 가장 넓은 아키텍처에 속한다. 백엔드 면에서도 Apple의 Firestorm은 7개의 정수 실행 유닛과 전작 대비 33% 확장된 4개의 FP/Vector 연산 유닛을 보유한다.

2020년 11월 13일, 데스크탑용 벤치마크 툴인 시네벤치 R23버전이 업데이트되면서 Apple Silicon 버전 macOS를 지원하기 시작했다. 여기서 저번 6월에 공개됐었던 A12Z Bionic이 탑재된 개발자 킷의 벤치마크가 유출되었는데, 점수는 싱글 987점, 멀티 4530점으로 나왔다. 이는 AMD Ryzen 5 2400G와 비슷한 점수다. 랩탑 라인업에서는 Intel Core i5-1035G7과 비슷하다.

2020년 11월 16일, Apple M1 탑재 MacBook Air의 Rosetta 2 에서 돌아간 긱벤치 점수가 공개되었다. 즉 M1에서 x86 mac을 에뮬레이팅한 것인데, 점수는 싱글 1300점, 멀티 5800점으로 이는 현존하는 Apple의 모든 인텔 Mac보다 싱글코어 점수가 높고 멀티코어는 i7-9750H보다 10%가량 높다. 사실상 M1을 x86으로만 돌려도 대부분의 인텔 Mac 성능을 능가한다는 것이다. 참고로 네이티브 환경에서 긱벤치를 돌렸을 때의 80% 정도의 점수다.

2020년 11월 17일, Apple M1 탑재 13형 MacBook Pro의 시네벤치 R23 버전 점수가 공개되었다.# 싱글 약 1500점, 멀티 약 7500점으로 싱글점수는 라이젠 5600X, 멀티점수는 라이젠 2600X와 비슷한 점수이며, 저전력 프로세서와 비교하면 싱글코어는 i7-1165G7과 비슷하며#, 멀티코어는 라이젠 4600u 보다 낮은 수준이다.# 긱벤치상으론 싱글코어 1700점대, 멀티코어 7500점대로 상당히 높은 점수를 자랑하며 이마저도 전력소모량과 발열량까지 따진다면 오히려 x86쪽에서 비교할만한 CPU가 사실상 없는 상태다.

2021년 기준으로 여러 기업들이 애플의 뒤를 따라 독자적인 ARM칩을 개발하기 시작했으며 대부분 기업들이 인텔으로부터 벗어나려고 ARM 칩을 개발한다는 공통점이 있다.
2021년 2월 6일, 인텔이 대놓고 애플의 M1을 겨냥한 보도자료를 올렸다. 해당자료에 의하면 타이거 레이크가 더 우수하고 M1은 제한적이고 거짓이라는 내용인데 사실상 인텔이 Apple Silicon을 직접적인 경쟁자로 취급할 정도로 크게 경계하는 셈이다.[12] 엔트리급 레벨에 불과한 M1칩에 대해 이렇게까지 반응하는 정도라면 ARM 진영을 크게 의식하는건 확실하다.

2021년 3월 3일, 애플이 애플 실리콘으로 이주하면서 추가한 번역기인 로제타 2가 11.3 업데이트에서 일부 지역에서 사라질 수 있다는 유출이 나왔다. 로제타 2가 사라지면 더 이상 x86 프로그램을 Apple Silicon 기반 Mac에서 쓸 수 없기에 논란이 되고 있다.

2021년 3월 10일, Petapixel이란 블로그에서 정식으로 애플 실리콘에 최적화되어서 출시된 포토샵을 테스트했는데 뛰어난 성능을 보여준다는 결과가 나왔다. 비교대상으로 Dell XPS 17에 인텔 코어 i9-10875H, 32기가의 램, 그리고 엔비디아 RTX 2060 Max-Q를 탑재한 버전으로 가격과 체급차이가 무척 차이남에도 불구하고 소폭 앞서는 결과를 보였다.[13] 특히 Photomerge 항목에선 그동안 리뷰한 16인치 맥북프로와 레이저 블레이드 스튜디오를 포함해 어떤 노트북도 100점을 넘은 적이 없었는데 130점을 넘었다고 한다. 대신 GPU 항목에선 RTX 2060에 비해 40% 수준의 점수를 기록했다. 당연하게도 로제타 2로 돌린 포토샵보다 훨씬 더 빠르며 인텔 H 시리즈급 성능을 보여준다는건 전성비가 매우 뛰어나면서도 실질적인 성능도 높다고 볼 수 있다. 결정적으로 M1칩은 겨우 인텔의 Y 시리즈에 해당되는 체급이라 상위버전들이 등장한다면 더더욱 높은 성능을 보여줄 수 있어 보인다.

2021년 4월 13일, 엔비디아가 처음으로 데이터 센터용 CPU를 개발 및 생산할 예정이라고 발표했다. ARM 기반 CPU이며 인텔과 AMD의 직접적인 경쟁자가 된다고 언급까지 하고있다. 2023년부터 출시할 에정이며 사실상 인텔의 제온 시리즈와 AMD EPYC 시리즈를 직접적으로 겨냥 및 경쟁할 예정이라 보아도 무방하다.

한편 MediaTek은 Chromebook과 스마트폰을 위한 칩에 엔비디아 그래픽 API를 탑재한다고 발표했다. 삼성이 AMD 그래픽을 쓰는 것처럼 MediaTek은 엔비디아 그래픽을 쓰는 것으로 모바일 ARM칩의 그래픽 성능이 기존보다 훨씬 더 개선될 것으로 예측되고 있다.[14]

2021년 6월 19일, 삼성과 퀄컴이 다시 커스텀칩 개발에 돌입했다고 한다. 기존에는 애플처럼 CPU와 GPU 둘다 커스텀으로 개발한다고 하는데 삼성과 퀄컴이 시도했었지만 실패함에 따라 커스텀화를 포기했었다. 하지만 상황이 계속해서 변하고 있음에 따라 다시 커스텀칩 개발에 돌입한걸로 보이며 퀄컴의 경우, 애플칩을 개발한 인력들이 창립한 누비아를 인수함에 따라 퀄컴도 다시 도전할걸로 보인다.[15]

2021년 6월 25일, Microsoft가 차세대 운영체제인 Windows 11을 발표했으며 macOS Big Sur처럼 x86과 ARM 둘다 지원하고 특히 Android 앱을 인텔 브릿지 기술로 그대로 사용할 수 있는 큰 변경점이 생겼다. 또한 Windows 10 on ARM에서 지원되지 않았던 64bit 프로그램 에뮬레이션도 드디어 공식적으로 지원함에 따라 기존 64bit x86 소프트웨어를 ARM 기기에서도 돌릴 수 있게 되었다. 또한 x86 코드에 ARM코드를 섞어쓸 수 있다고 한다. Apple Silicon맥 이후로 이렇다할 ARM 운영체제가 생긴 셈인데 타회사들의 유입이 본격적으로 이루어질걸로 추정된다.[16] 특히 애플이 모바일앱을 맥에서 돌릴 수 있다면서 정작 모바일 개발자들이 전혀 관심이 없어 하는 상황이라 Windows 11이 모바일앱 부분에서 앞지를 가능성이 있다.[17]

2021년 7월 19일, Nvidia가 ARM 플랫폼에 RTX와 DLSS을 제공한다고 한다. ARM 플랫폼에서도 게이밍 점유율을 올리려고 한다는 내용이 기사에 있으며 Nvidia랑 협력중인 MediaTek가 Nvidia GPU를 탑재한 노트북 ARM SoC칩인 Kompanio 1200를 개발중이라고 한다.[18] 사실상 ARM 기반 컴퓨터도 RTX와 DLSS를 사용함으로써 게이밍쪽으로도 확장할 수 있을걸로 보인다. 이미 레이 트레이싱을 무려 Linux 기반 Chromebook에서 울펜슈타인 영 블러드를 돌리는 데모 영상이 있다.

2021년 8월 5일, 구글이 드디어 독자적인 칩인 구글 텐서칩을 개발해서 구글 픽셀에 탑재했다.# 기존 구글 픽셀 스마트폰들은 퀄컴의 스냅 드래곤을 채용했었지만 텐서칩을 개발함으로써 퀄컴칩을 대체하게 되었다. 기존 퀄컴기반 노트북들도 구글이 독자적으로 개발한 칩으로 대체할 가능성이 있다. 또한 텐서칩을 쓴 Chromebook을 2023년까지 내놓는걸 공식적으로 인정했다.#

2021년 9월 16일, AMD가 고객의 요구가 있다면 ARM칩을 생산할 준비가 되어 있다고 입장을 밝혔다.#

2021년 10월 18일, 애플이 14/16인치 MacBook Pro를 공개하면서 M1 ProM1 Max라는 차세대 칩도 공개했으며 역대급 성능과 전성비로 인해 매우 큰 주목을 받고 있다. 특히 GPU의 경우, 전력 소모량은 상당히 낮은데도 불구하고 성능은 모바일 3060과 3080급으로 추정될정도로 뛰어난전성비를 보여주고 있다. 실제로 32코어 기준으로 프리미어 프로와 다빈치 리졸브에선 모바일 RTX 3080다운 성능 혹은 그 이상을 보여주고 있다.[19]

2021년 10월 27일, 인텔 12세대 CPU가 발표되었다. 성능은 전세대 대비 상당한 상승을 보였는데 ARM칩과 비교해서 주목할 점이라면 전압과 클럭, 코어를 조절해 모바일 프로세서와 비슷하게 셋팅할 경우 M1 맥스와 성능과 전성비로 밀리지 않는다는 실험결과가 나왔다.[20][21] 추후 정식 모바일버전으로 출시될 경우 재확인이 필요할 듯.

2021년 11월 22일, Microsoft와 퀄컴간의 비밀 계약으로 인해 Windows 11 및 ARM 기반 Windows가 다른 컴퓨터에 지원되지 않았다는 소식이 나왔다. 마소-퀄컴 계약이 곧 끝난다고 하니 추후에 삼성이나 애플은 물론 다른 회사들도 ARM 기반 컴퓨터에 Windows 11을 사용할 수 있을걸로 보인다. [22]

2022년 2월 15일, 인텔이 무려 x86 CPU 라이센스를 타회사에게도 공개할 예정이라고 한다. # 즉, IntelAMD 외에도 x86 기반 CPU를 개발할 수 있게 된다는 얘기다!

2022년 2월 25일, 밸브 코퍼레이션AMD의 협업으로 Zen 기반의 SoC가 등장했는데, 5W 미만, 로드시 15W대로 동작하는 AMD64 프로세서가 등장하며 x86, CISC 디코더를 가지고 있어 전성비가 좋지 않다라는 인식을 반증하며 ARM 계열 SoC들의 전성비 격차를 좁혀가는 모양새를 보여준다.[23]

2023년 5월, AMD에서 Z1 SoC가 발표된다. 그래픽 프로세서와 CPU가 모두 사용되어도 30W 전후의 소비 전력을 보여주고 이를 탑재한 핸드헬드 게이밍 PC들이 등장한다. 이 때 전성비는 Apple의 M3와 비슷한 수준이다. 비슷하게 Intel 또한 비슷한 프로세서를 출시했으나 실 제품 (MSI Claw)는 떨어지는 전성비를 보이며 x86계열 프로세서의 떨어지는 전성비는 그 자체로서의 문제가 아닌 Intel의 전성비 설계 문제가 더 크게 보이는 상황이다.

4. 전망

4.1. ARM 우세

먼저 x86이 고성능에 적합하다는 편견은 ARM의 ISA(Instruction Set Architecture, 명령어 집합 구조) 자체가 고성능에 적합하지 않다는 시각에서 나온다. 이는 마이크로아키텍처와 ISA를 착각했기 때문에 나오는 오해다. 과거에 ARM의 마이크로아키텍처는 철저한 저전력과 그 범위 내에서의 성능을 추구한 물건이었고, 이것은 고성능 작업에 적합하지 않다는 것이 사실이다. 그러나 고성능으로 디자인되는 것은 ISA의 문제가 아니다. 고성능 마이크로아키텍처로 설계하면 ARM도 충분히 고성능이 나오고, 실제로 이미 나오고 있다. 오히려 x86은 ISA부터 잘못 만들었다는 평을 듣는 정도의 물건이다.

일부에서는 ARM 프로세서의 성능이 비약적으로 향상된 것은 사실이지만, x86을 대체할 수 있을 정도는 아니라는 말을 하기도 한다. 그러나 이는 실제와는 거리가 멀다. 우선 ARM 프로세서의 성능은 매우 엄격하고 제한된 환경에서만 구현 가능한 것이라는 자체가 이상한 접근이다. x86 기반의 시스템이 유지되는 것은 현재 PC와 서버 시장을 장악하고 있는 x86 아키텍처 자체에 기반을 둔 소프트웨어 호환성과 인프라가 대부분이기에 바꿔서 얻는 성능 이익에 비해 전환 비용이 더 크다는 것이 진짜 큰 이유다. 폐쇄적 환경으로 그러한 영향을 덜 받은 Apple은 아키텍처 전환에 큰 문제 없이 전성비적으로도 성능적으로도 큰 이익을 얻었다. 레거시 환경의 핵심을 이루고 있는 MS까지 괜히 나서서 WoA 같은 거 만드는 게 아니다. 아닌게 아니라 x86의 성능 향상 한계에 조금이라도 대비하는 것이다.

심지어 후지쯔에서 제작한 ARM 슈퍼컴퓨터 후가쿠가 단순 연산속도 뿐만 아니라 산업 이용 능력 평가치 HPCG 및 빅데이터 능력 평가 Graph 500, AI성능 평가 HPL-AI 등 모든 부문에서 세계 1위를 차지했다. x86의 영역으로만 보이던 HPC 영역에서 ARM 기반 컴퓨터가 세계 1위를 차지하며, "ARM은 고성능을 못 낼 것이다" 라는 말이 쏙 들어가게 되었다. 이렇게 한번에 모든 분야에서 세계 1위를 기록한 것은 후가쿠가 처음이며, 동시기에 나온 AppleApple Silicon과 함께 ARM은 x86보다 뒤쳐진다는 기존 선입견을 박살낸 사례로 평가받고 있다. 게다가 슈퍼컴퓨터에 Nvidia GPU들도 많이 사용되지만 정작 후가쿠는 CPU만 사용해서 세계 1위를 달성한 것이다.

이러한 성과에도 ARM 기반은 x86의 시장을 완전히 잠식할 수는 없다. 레거시 소프트웨어들이 x86 아키텍처에 맞춰져 있으며, 기존의 명령어셋을 모두 갖추고 있는 만큼 호환성 걱정도 없기 때문에 성능이 부족하면 막말로 스케일 업 하면 끝이고, 소프트웨어를 새로 개발할 필요도 없기 때문이다. 또한 그동안 업계에선 ARM을 이용해 고성능을 내볼 생각조차 없었기에 ARM의 성능 향상이 전환 계획이 있던 Apple을 제외하면 인프라도 없고, 컴파일러의 최적화도 영 미흡한 수준이었다. 그러나 이런 흐름도 달라지고 있는 신호라고 볼 수 있는게, ARM이 고성능을 위한 ARM Cortex-X 시리즈를 2020년에 내놓았다. ARM은 고객사에 ISA를 라이센스하고 마이크로아키텍처를 라이센스 한다. 고성능 ARM에 대한 수요가 발생하고 있다는 것이다. 이 때문에 Apple, IBM, 모토로라의 Mac+PowerPC 조합을 박살내며 승승장구하던 윈텔 진영도 인텔의 부진과 마이크로소프트가 Windows 10 on ARM을 내놓는 등 흔들거리고 있다.

이미 M1칩만 해도 작업용 소프트웨어상의 성능이 체급차이를 무시하고 능가하는 경우가 발생하고 있다. # 프리미어 프로와 라이트룸은 TDP부터 45W인 H 시리즈를 능가하며 이마저도 외장 그래픽카드가 달려있음에도 불구하고 M1이 더 앞선 결과를 보여줬고 베타 버전인데도 이런 성능을 보인 것이다.

4.2. x86 우세

현대의 컴퓨팅 기술은 고성능, 저전력, 유연성이라는 세 가지 서로 다른 목적을 동시에 달성할 수 없다.[28] 대표적인 예로 동영상 코딩을 하는 경우 전용 하드웨어 가속기인 ASIC은 성능과 전력 효율은 최고지만 동영상 코딩 그 외의 작업은 하는 것이 불가능하다. (고성능+ 저전력+ 유연성-) 그에 비해 CPU와 같은 범용 프로세서를 ASIC 급으로 동작시키기 위해서는 클럭을 높이거나 탑재 트랜지스터를 늘리지만 그와 비례해 물리적인 트랜지스터의 증가로 소비전력이 높아지게 된다. (고성능+ 저전력- 유연성+) 그리고 다시 여기서 소비전력을 낮추기 위해서는 트랜지스터의 수를 낮추거나 클럭을 낮추는 등의 방법을 사용하면 성능을 희생해야만 하는 것이 그 예이다. (고성능- 저전력+ 유연성+) 이러한 이유 때문에 개념을 혼동하여 간혹 특정 프로세서의 성능이 과대평가 되는 경우가 있는데 8K HEVC HIGH10 422 영상을 디코딩하는 시나리오에서 하드웨어 가속기가 탑재된 저전력 SoC와 64코어의 AMD Ryzen Threadripper 3990X는 동일한 재생 성능을 보여 준다는 단편적인 것 하나만으로 두 프로세서의 성능이 같다고 보기 어려운 것이 그 예이다. 기본적으로 실리콘 면적과 성능은 비례하고, 성능과 전력은 반비례한다. ARM 계열 마이크로아키텍처는 저전력/고성능은 달성 가능하지만 유연성이 부족하고, AMD64 계열 마이크로아키텍처는 고성능/유연성은 달성 가능하지만, 저전력을 구현하기 어렵다.

ARM 계열 마이크로아키텍처는 지금까지 저전력이란 목표를 먼저 설정하고 성능을 구현하는 방식으로 저전력/고성능을 추구해왔으나, Cortex-A15에서 한계에 부딪혔다. 이후 저전력 + 고성능 하이브리드 코어 구성방식인 ARM big.LITTLE 솔루션을 도입한 상황이다.[29] 폴락의 법칙으로 인해 고성능은 다이의 크기와 비례하므로 성능을 높이면 전력소모가 늘어날 수밖에 없으며, ARM 계열 마이크로아키텍처라고 뾰족한 방법이 있는 것은 아니다.

ARM 프로세서의 성능이 비약적으로 향상된 것은 사실이지만, 일부에서 주장하는 것처럼 x86을 대체한다던가 서버 시장을 휘어잡을 것이라는 예상은 현실과 거리가 멀다. 최근 들어 주요 대기업들이 ARM과의 호환성을 늘리는 작업을 진행 중이기는 하지만, 이는 x86 진영이 흔들리는 것이 아니라 플랫폼의 확장 개념으로 받아들여야 한다. 현재 PC와 서버 시장을 장악하고 있는 x86 계열 마이크로아키텍처는 일반적인 인상과는 달리 고성능이 아니며[30] 전력대 성능비도 나쁘지만[31], 매우 뛰어난 유연성과 적당한 성능, 비교적 저렴한 가격 대가 경쟁 우위이다.

참고로 전력대 성능비를 보면 전용 IC > GPU > CPU 순서이다. 인텔 동영상 디코딩/인코딩 유닛인 QSV가 전력당 성능비가 좋은 이유도 동영상을 처리하기 위한 기능을 하드웨어적으로 내장했기 때문이다. 이러한 현상은 현행 제품들에서도 보이는데 x86 아키텍처 기반 프로세서들은 한없이 CPU에 가까운 구조이고, ARM 아키텍처 기반 프로세서들은 전용 IC와 GPU 중간쯤 되며, 범용 유닛과는 거리가 멀다. 애초에 ARM 아키텍처를 사용한 제품들은 목표 전력을 먼저 설정해놓고 기능을 구현하는 형태이며, 부족한 성능을 전용하드웨어 유닛을 추가하여 보완하는 구조이기 때문이다. ARM 아키텍처의 변천사를 보면 저전력을 기본으로 시장에서 요구되는 여러가지 기능들을 지속적으로 추가시켜 온 것을 알 수 있다.

ARM(CPU)는 전력당 성능비를 앞세워서 영역을 넓혀오다가, 주류 시장 진입을 노리면서 비순차 명령어처리나 L2 캐시 같은 성능 중시 기술을 도입한 것이다. 엄밀히 말하면 ARM 아키텍처는 범용 아키텍처가 아니며, 전용 IC에 가까운 형태였던 CPU가 여러가지 기능을 추가하고, 시장을 넓히면서 점차 범용 아키텍처화 되고 있는 것이다. 그리고 그 결과의 산물이 Cortex-A15인데 범용 마이크로아키텍처화되면서 저전력이란 장점을 잃어버렸다. 최근 발표 된 Armv9 기반의 Cortex X2, A710, A510는 저전력 환경에서 성능 차이가 크지 않으며 전력 소모가 높아지면 성능 차이가 커진다.# 따라서 미세 공정이 적용되지 않으면 전성비는 향상되지 않는다.

2023년 6월, 애플에서 기존 인텔 CPU 대신 자사의 애플 실리콘을 장착한 2023년형 맥 프로를 발표했는데, 확장성뿐만 아니라 기초적인 성능에 있어서도 워크스테이션이라고 하기에는 너무나 민망한 수준으로 큰 비판을 받고 있다. 해당 문서에 자세히 서술된 성능상의 뒤떨어지는 점만 봐도 알겠지만, ARM 계열 프로세서의 근본적 한계라고 할 수 있다.

5. 관련 문서



[1] 64비트 모드인 롱 모드에서는 이러한 16비트 시절 명령어들은 Illegal instruction 오류를 내며 아예 동작하지도 않는다. 이 때문에 현 AMD64 규격에서 레거시 관련 부분을 애플의 ARM 프로세서가 AArch32부분을 제거한 것 처럼 실리콘레벨에서 제거하는 X86-S가 제안된 적이 있으나 2010년대 후반의 CPU 게이트, 2020년대 초반의 13, 14세대 제품 결함, 15세대 성능 부진 등을 연달아 겪으며 인텔이라는 기업의 존재 자체에 위기가 닥친 상황인지라 사실상 인텔이 단독으로 추진하고 있던 본 안건에 대해 신경쓸 여유가 없어졌고 2024년 12월 기준 폐기된 것으로 알려져 있다.[2] 당시 시대적 한계로 인해 만들어졌던 메모리 세그먼트 (address := segment+offset)같은 모델은 현대 컴퓨팅에서는 비효율적이고 더러운 모습이지만 AMD64에서는 그런 모델은 사용되지도 않고 지원하지도 않는 것이 그 예이다.[3] 이런 심각한 파편화 때문에 시중엔 v8.4, v8.5, v8.6 를 사용한 ARM CPU는 출시도 안됐지만 v9까지 발표되었다. 이 때문에 ARM Holdings에선 v9에 v8.6 까지의 명령어를 구현하겠다고 선언한 상태다.[4] Power Struggles: Revisiting the RISC vs. CISC Debate on Contemporary ARM and x86 Architectures[5] AVX10에 포함되지만 현재 개인 사용자용으로 AVX512를 지원하는 AMD ZEN4에는 없는 유일한 세트[6] 특히, 2019년 8월부터 플레이 스토어에서 64비트 지원이 의무화 되면서, 유니티 엔진의 x86_64 미지원 때문에 업데이트 과정에서 x86을 통째로 미지원하게 된 게임도 많다.[7] Mac mini의 폼팩터를 사용했다.[8] 슈퍼컴퓨터는 근본적으로 돈을 얼마나 퍼붓느냐의 경쟁에 가깝긴 하다.[9] 서피스 프로 X (2020)과 M1 둘다 비슷한 시기에 나왔다.[10] 애플이 후발주자이고 이마저도 칩 전문회사도 아닌데 인텔이 뒤쳐졌다고 한탄한 셈이다. 애플을 라이프 스타일회사라고 비아냥거렸지만 애플이 다른 회사를 대하는 태도에 비하면..[11] 이미 자사 노트북중에서 라이젠을 탑재한 제품이 존재한다.[12] 다만 인텔이 보도자료로 여러 번 사기친 전적이 있어서 대놓고 믿으면 안된다. 당장 해당 자료에서 쓰인 모바일 CPU는 TDP 28W급인 1185G7을 썼고 발열이나 전력소모량에 대해선 아무런 언급조차 안 했다. M1칩은 인텔 모바일 CPU Y 시리즈보다 더 낮은 발열량과 전력소모량을 가지고 있기에 애초에 비교 자체가 이상한것이다.[13] i9-10875H는 TDP만 45W로 M1보다 훨씬 더 높은 발열량과 전력소모량을 가지고 있으며 외장 그래픽카드까지 탑재했으니 실질적인 체급 차이는 매우 크다할 수 있다.[14] 그럴 것이 ARM칩을 쓰는 회사중 그래픽 성능이 높은건 애플밖에 없다. 애플은 독자적으로 개발해서 쓰고 있지만 타회사들은 ARM 레퍼런스 모델을 그대로 쓰거니와 애플처럼 개발하려고 했다가 죄다 포기한 상태다. 격차가 크다보니 기존 그래픽카드 회사들인 AMD와 엔비디아에게 도움을 얻는걸로 보인다.[15] 실제로 애플쪽에서 불만을 토로했었다.[16] 하지만 지금조차 M1에 버금가는 ARM칩이 단 하나도 없기에 ARM 참여률은 당분간은 낮을 수밖에 없다.[17] 차이점이라면 애플은 모바일앱이라도 맥 환경에 맞춰서 최적화 해줘야 한다는 것이고 Microsoft는 모바일앱을 아무런 최적화 및 수정없이 그대로 사용해준다는 것이다. 원래는 사이드로딩이라고 해서 애플도 모바일앱을 우회해서 그대로 사용할 수 있었지만 애플이 보안문제를 거론하면서 막아놓았다.[18] 그래픽카드는 3060이다.[19] 게임의 경우, 대다수 게임들이 Windows 기반이기 때문에 최적화 수준에서 많이 뒤쳐진다. 애초에 Metal API는 오로지 애플만 쓰기 때문에 최적화 난이도가 높으며 이마저도 macOS의 수익률이 낮기 때문에 개발자 및 개발사들이 제대로 지원하지 않는 것도 한몫하고 있다.[20] 다만 전력제한이 없는 데스크탑 다이로 테스트했고 모바일 다이는 전혀 다르기에 명확한 실험은 아니며 결정적으로 애플 실리콘은 시네벤치에 제대로 최적화되지 않았다. 오히려 인텔기반 명령어를 쓰기 때문에 인텔이 더 유리할 수밖에 없다.[21] 또한 전력소모량은 30W가 아닌 여전히 45W로 최대 30W까지 사용하는 M1 Pro/Max에 비해 50% 이상의 전력소모량을 가지고 있다.[22] 다만 Rosetta 2같은 번역기가 없어서 기존 x86 소프트웨어들을 사용할 수 없어서 실질적으로 사용하기 힘들다는 점, Apple Silicon맥에 비해 지원되는 소프트웨어 갯수가 매우 적다는 점, 그리고 결정적으로 Apple외엔 강력한 칩을 만들 수 있는 회사가 사실상 없다는 점으로 인해 넘어야할 산들이 많다.[23] 사실 x86계열 프로세서의 소비전력은 CISC라는 ISA와 이를 해석하는 디코더의 문제가 아님을 증명하는 연구가 있다.[24] 하지만 기존 인텔과 AMD만 해도 CPU 관련 업데이트를 많이 했어야 하는데 삼성, 퀄컴, MediaTek, 기타등등 무수히 많은 회사들이 참여하는 것은 차원이 다른 얘기다.[25] 이는 Apple A13과 A14의 성능향상폭인 21%보다 더 크다![26] 컴파일러가 자동으로 해 주는 SIMD와 같은 벡터 명령어 최적화는 인간이 우수하다.[27] 이미 테슬라가 최적화 이유로 엔비디아를 버리고 독자적인 ARM칩을 개발한 사례가 있다.[28] 경제학에서 불가능의 삼각정리와 유사하다.[29] ARM 빅리틀은 저전력 4코어+고성능 8코어 조합이다. 인텔 레이크필드도 저전력 4코어+고성능 1코어 조합을 채택했다.[30] 종합 성능에서는 IBM POWER보다 많이 뒤쳐지며, 특정 연산 성능 한정이라면 GPU에게 추월당한지 오래됐다.[31] ARM 프로세서에 모바일 시장을 뺏긴 이유이다.[32] The filing also disputes U.K. regulator’s assumption that licensees such as Apple and Qualcomm demonstrate Arm’s ongoing success. To the contrary, it notes, “Architectural licensees do not use Arm’s CPU designs. Arm architectural licensees create their own proprietary CPU designs using their own engineering teams in the United States.[33] M1만 해도 Apple이 모두 설계했지 ARM은 전혀 관여조차 안 했다고 언급했다. 그저 ARM의 명령어셋만 이용할 뿐이다.[34] Amazon이나 Ampere에서 만드는 데이터 센터용 ARM 칩 모두 커스텀칩이다.[35] 다만 토발즈가 ARM 자체를 싫어하는 건 아니다. 그는 항상 노트북급 성능을 가지는 ARM 시피유가 있었으면 좋겠다고 했으며, 실제로 Apple에서 x86 대신 ARM을 넣은 맥을 발표하자, 해당 소식에 기뻐했다. #[36] 리얼텍이 인수. 그 때문에 리얼텍의 MIPS 프로세서와 SoC들은 Lexra-MIPS 아키텍처가 사용된다.[37] Lexra MIPS의 라이센스와 특허 문제로 인해 몇가지 명령어의 구현을 생략했다[38] 다만 퀄컴 때문에 ARM 버전의 Windows 11을 애플을 포함해서 다른 회사들이 사용하지 못하는 상황이기 때문에 당연하지만 셀러가 없을 수밖에 없다.