본문 바로가기
경제/돈버는 이야기

[펌] M1 프로세서의 탄생사 및 애플 실리콘에 대해 Araboja.

by Sallyyyy 2021. 9. 30.
반응형

 

 

인텔 잡아먹는 모바일 프로세서. 외계인 고문 맛집 애플 실리콘의 역사를 알아봅니다.

[BY Tech Box] 애플 실리콘. 이제 아마 이 이름을 모르시는 분은 거의 없을 것이라고 생각합니다. 사실, ...

m.post.naver.com

애플 실리콘. 이제 아마 이 이름을 모르시는 분은 거의 없을 것이라고 생각합니다.
사실, '애플 실리콘'은 2020년 WWDC에 이어 키노트에서 M1이 발표되면서 사용된
이름이라  M1만이 애플 실리콘을 뜻하는 거라고 생각하시는 분들도 있는데,
사실 애플은 애플 실리콘을 오래 전부터 개발하고 자사의 제품에 탑재해 왔습니다.

어느 순간부터, ARM 아키텍쳐 기반 프로세서를 개발하는 타 제조사의 기술력을 앞서 가기 시작하더니, 모바일 AP 제조사를 넘어서
이제는 반도체 업계의 거인, 인텔을 바짝 추격하고 있는 명실상부 최고의
ARM 아키텍쳐 기반 프로세서 제조사가 되었습니다.

이제는 모든 애플 기기에 애플 실리콘이 탑재되기 시작하면서 애플의 생태계 대통합에서
상당히 중요한 역할을 맡게 되었고,
애플을 또 다시 혁신의 아이콘으로 탈바꿈
시켜주었습니다.

오늘은, 이 애플 실리콘의 역사와 발전 과정에 대해 살펴보려 합니다.


 




저전력, 저발열의 ARM
CISC와 RISC.

일단 애플 실리콘에 대해 설명하려면 그 모체가 되는 ARM부터 설명을 해야 할 것 같습니다

ARM은 Acorn Computers라는 한 회사에서 개발하였습니다.
당시 Acorn Computers는 자사의 비즈니스용 컴퓨터에 사용할 프로세서를 찾고 있었는데,
기성품에서 마땅한 프로세서를 찾을 수 없게 되자, 자사에서 프로세서를 직접 제작하게
됩니다.

RISC 기반으로 만들어진 이 프로세서를
Acorn RISC Machine의 약자를 따
ARM이라고 부르게 됩니다.
(추후 Advanced RISC Machine으로 바뀜)

ARM 프로세서는 한가지 특징이 있었는데,
바로 낮은 소모 전력이였습니다.
낮은 전력으로도 동작할 수 있는 특성 덕분에 현재 모바일 시장에서 널리 사용되고 있는 것이죠.

이는 ARM에 사용된 RISC 방식 덕분이라고
할 수 있습니다.
이에 관해 간단히 설명드리자면...

현재 프로세서에 사용되는 설계방식은 RISC와 CISC 방식이 있습니다.
RISC는 대표적으로 ARM, IBM POWER 등등에 사용되는 방식이고,
CISC는 현 Intel x86, AMD64에 사용되는 방식이죠.

사실, RISC와 CISC는 컴퓨터 공학에서 사용되는 용어라 자세히 설명드리려고 하면
제 멘탈도 갈리고 여러분 멘탈도 갈리니....
간단하게 설명하겠습니다.

RISC(Reduced Instruction Set Computer)는 CPU 명령어의 길이가 일정하게 고정되어
명령어의 해석에 필요한 하드웨어의 구조를
간단하게 제작할 수 있습니다.

반대로 CISC(Complex Instruction Set Computer)는 복잡하고, 명령어의 길이를 가변적으로 설정함으로써, 명령어의 효율성을 높일 수 있지만, 명령어의 길이가 제각각이기 때문에 명령어 해석에 필요한
하드웨어의 구조가 복잡해진다는 단점이 있습니다.

RISC 방식은 CISC에서 실제로 많이 쓰이는 명령어는 전체에서 얼마 되지 않는다는 점을 이용한 것인데,
이를 통해 하드웨어의 구조를 간단하게 만들 수 있다보니, 높은 전성비와 적은 발열의 프로세서를 만드는데 유리합니다.(물론 제조사가 설계를 이상하게 하면 PowerPC처럼 저거도 발열괴물이 됩니다.)

물론, 무조건 RISC가 무조건 좋다는 건 아닙니다.
프로그램 코드가 길고 복잡해지고, 소프트웨어의 비중이 늘어나거나, 호환성이 떨어지는 등,
파고들어가 보면 RISC도 당연히 많은 단점을 지니고 있습니다.

하지만, 현재는 RISC의 단점도 어느정도 개선되고 극복된 동시에
현재는 CISC와 RISC가 서로의 장점을 공유하듯 사용하는 형태가
많이 이용되는 추세이기 때문에, 둘 사이의 경계가 많이 모호해졌습니다.



ARM Holdings와 애플

1990년대 말, 흔히 애플의 암흑기라고
불리던 시절.
애플에서 PDA를 개발한 적이 있었습니다.
이름은 Newton MessagePad.

애플은 이 PDA를 만들기 위해,
전성비가 우수한 프로세서를 찾고 있었는데,
그때 애플이 선택한 것이 바로 ARM입니다.

그래서 Acorn Computers에서
ARM 개발 부서를 때어내 VLSI Technology와
합작 회사를 설립하였는데,
이것이 바로 지금의 ARM Holdings입니다.

ARM Holdings는 직접 프로세서를
만들지는 않았지만,
프로세서의 라이센스를 판매하는 방식을
사용하였는데,
이 덕분에 지금 여러 회사들이 ARM 기반
프로세서를 개발하고 있는것이죠.

ARM의 프로세서는 네비게이션, PDA와 같은 모바일 기기에 주로 사용되다가,
2010년대에 스마트폰과 태블릿 시대가
열리게 되면서, 저전력, 모바일용 프로세서의 강자로 급부상하게 됩니다.

이렇게 보면 애플이 모바일 시장에 끼친
영향력이 상당하다고 할 수 있죠.
자사의 애플 실리콘 이전에, 현 모바일 기기의 AP로 주로 사용이 되는 ARM의 시작에
애플이 있는 것이니까요.

물론, 현재는 애플이 90년대에 ARM의 주식을 매각해 지분이 없는 상태이지만,
얘네들이 ARM까지 독점했으면 지금 휴대폰
500만원 주고 사야 했을지도
ARM Holdings의 시작을 함께한 것도
애플이고, 현재 명실상부 ARM 기반 프로세서
제조사 1위의 자리를  차지하고 있는 것을 보면 참 아이러니합니다.




애플 실리콘, 첫시작. A4

아이폰 4, 아이패드 1세대, 아이팟터치 4세대, Apple TV 2세대.

애플 실리콘의 첫 시작은, 아이패드와
아이폰 4가 출시되던 때로 거슬러 올라갑니다.
당시 애플의 CEO 스티브 잡스는 아이폰 4를 소개하면서 A4칩을 소개합니다.

이전작 아이폰 3GS까지는 삼성의 엑시노스를
사용했었지만, 이번에는 애플의 하드웨어 칩 디자인 팀에서 개발한 칩을 사용했다고
발표했습니다.

하지만, A4칩은 애플의 이름을 달았다를 빼고는 딱히 애플이 설계했다고 보기에는
애매한 칩셋이였습니다.

아직 애플은 ARM이 개발한 마이크로아키텍쳐를 빌려와 커스텀하는 수준이였고,
(ARM Cortex-A8 기반)
칩 자체 커스텀도 삼성과의 공동 개발이였으니까요.

당시 스티브 잡스는 전력효율과 성능향상에
대해 중점적으로 이야기를 했었는데,
실제로 A4는 당시 모바일 프로세서에서는
높은 클럭이였던 1Ghz의 벽을 돌파하였고,
전작 아이폰 3GS 대비 많은 성능 향상이
있었지만,
아이폰 4에 레티나 디스플레이가 탑재됨으로써 전작대비 픽셀 밀도가 4배가량 증가하면서,
일부 게임 성능이 저하되는 웃지 못할 상황도 있었습니다.

당시 배터리 관련 문제로 A4의 클럭은 1GHz였지만 아이폰 4에는 800Mhz로 다운클럭되어 장착되었는데, 탈옥툴을 이용해 이를 1Ghz로 다시 오버클럭 하는 유저도 있었습니다.



성능 떡상. 듀얼코어 A5

아이폰 4s, 아이패드 2, 아이팟터치 5세대, 아이패드 미니, Apple TV 3세대.

A5는 A4를 공동 개발했던 프로세서 제조 회사인 인트린시티를 Apple이 인수한 후,
애플이 본격적으로 개발한 AP라고 할 수
있겠습니다.

 

Source : Anandtech(좌 : Geekbench[CPU], 우 : GLBenchmark 2.1 OpenGL ES 2.0[GPU])

A5는 성능 부분에서 많은 향상이 있었는데요,

먼저 듀얼코어(ARM Cortex-A9기반)가 채택되었습니다. 이로 인해 A시리즈 역사상 가장
극적인 성능 향상이 된 것으로 유명한데,
CPU성능은 약 2배, GPU 성능은 무려 7배나 상승했습니다.

아이패드 프로 5의 프로세서인 M1이 전작인 아이패드 프로 4의 A12Z에서
CPU 성능은 50%, GPU 성능은 40% 빨라졌다는것도 성능향상폭이 정말 크다는 것을
감안해 본다면, 각각 2배와 7배 상승은 가히 엄청난 수치라고 할 수 있겠습니다.

그리고 이때부터 고성능 태블릿에 장착되는
'X' 가 붙은 성능 강화 버전이 등장했습니다.


자체 아키텍쳐, A6

아이폰 5, 5C

A6부터는 상당히 의미있는 버전업이
이루어졌습니다.
바로 A6부터 애플이 독자 아키텍쳐를 개발해 사용하기 시작했기 때문입니다.

Apple Swift라는 이름의 아키텍쳐를
사용했으며, 이는 현재까지도 다른 ARM기반 프로세서 제조사와 애플이 차별화되는 가장 큰 차이점이자, 애플이 독보적인 성능의 프로세서를 만들 수 있는 기반을 마련해 주었다고 할 수 있습니다.

잠깐, 여기서 독자 아키텍쳐 개발과 '커스텀'하는 것의 차이점이 뭔지 설명하고
넘어가겠습니다.
아까 ARM은 자사 아키텍쳐를 라이센스 비용을 받고 판다고 했었죠?

다른 회사는 ARM의 아키텍쳐. 즉, ARM에서 만든 이미 조립이 되어있는 철골 구조물을
가져와서 거기다가 벽을 만들고 가구를 설치해서 건물을 만든다고 할 수 있습니다.

하지만, 애플은 ARM의 철골만 사옵니다.
이제 자기가 만들고 싶은 모양대로 철골을
설치/조립하고 그 뼈대 위에다가 벽을 만들고 가구를 설치해서 건물을 만드는 것입니다.



예전 포스팅에서 제가 '애플은 고집으로 먹고사는 회사'라고 말한적이 있습니다.
자사에서 아키텍쳐를 직접 설계함으로써
애플은 자기가 원하는대로,
자신의 고집대로 프로세서를 만들 수 있게
된 것이죠.


최초의 64비트, A7

아이폰 5s, 아이패드 미니 2, 아이패드 미니 3, 아이패드 에어 1세대

Source : iMore

A7에서는 모바일 AP에서는 최초로 64비트를 지원하는 CPU 아키텍쳐인
Apple Cyclone이 사용되었습니다.

애플은 당시 A7을 '데스크탑 클래스'라고
표현했었는데 64비트를 지원하고, 큰 폭으로 성능 향상이 이루어지게 되면서 경쟁사의 모바일 AP와 견주어도 뒤쳐지지 않을 만큼
성능이 향상됩니다.

더불어서 모바일 AP에 원래는 존재하지
않았던, SRAM.
즉, L3 Cache가 추가 되었습니다.
L3 캐시가 무엇이냐?

원래 프로그램을 실행시킬 때,
CPU는 메모리에 있는 프로그램을 불러와야
합니다.
하지만, CPU와 메모리는 서로 떨어져 있는데다가 속도 차이가 심하게 나기 때문에
둘 사이의 데이터 통신에서 병목이 발생합니다

이를 해소시켜 주기 위해 있는것이
바로 L1, L2, L3 캐시입니다.
메모리에 있는 프로그램을 캐시에 올려서
CPU에서 보다 빠르게 불러들일 수 있도록
하는것이죠.

L1, L2, L3로 분류해 놓은 것은
근본적으로 하는 역할은 비슷하지만,
순서에 따라 분류해 놓은 것입니다.

그래서 CPU는 찾는 데이터를 L1->L2->L3 순서로 찾아 프로그램을 실행시킵니다.
그래서 이 캐시는 넓으면 넓을수록, 많으면 많을수록 병목이 줄어들어 조금 더 좋은 성능을 낼 수 있습니다.

Source : AMD

이와 관련한 대표적인 예시로 라이젠의 CPU 구조를 들 수 있겠습니다.
위 사진은 Zen 2 아키텍쳐와 Zen 3 아키텍쳐의 구조인데요,
Zen 2에서 Zen 3로 넘어가면서 IPC가 획기적으로 향상된 이유중 하나가
바로 8개의 코어가 더 넓어진 L3캐시를 공유하는 것이였습니다.

기존 Zen 2에서는 8코어 프로세서에서 4개의 코어가 각각 16MB의 L3캐시와 묶여진 4CCX 구조로 두 코어간의 레이턴시와 캐시부족으로 인한 병목현상 때문에 성능이 저하되는 문제가 있었습니다.

하지만 Zen 3에서는 8개의 코어가 32MB의
L3캐시에 모두 접근할 수 있는 8CCX 구조를 채택하면서,
8개의 코어가 더 넓은 L3캐시에 접근,
두 코어간의 캐시 통신속도도 현저히 줄어들게 되면서 IPC가 큰 폭으로 향상될 수 있었습니다

그만큼 캐시의 여부나 크기는 CPU의 성능에서 중요한 역할을 합니다.

여담이지만, 추후 메모리 클럭이 향상되면서, 병목이 개선되어 애플 실리콘에서 L3 캐시가 들어가지 않은 모델이 등장하긴 합니다.

현재 A7 프로세서가 탑재된 아이폰 5s는 iOS 12까지
업데이트를 지원하게 되면서 2021년에도 카카오톡이나 유튜브 정도는
간단하게 사용이 가능합니다.



big.LITTLE 솔루션. A10 Fusion

아이폰 7, 아이폰 7 Plus, 아이패드 6세대, 아이패드 7세대, 아이팟터치 7세대

Source : Apple

A10에 들어서서 애플 실리콘에 큰 변화가
생겼습니다.
바로 저희에게 잘 알려진 big.LITTLE 솔루션이 채택된 것이였습니다.

big.LITTLE 솔루션은 ARM Holdings에서
개발한 전력 소모 개선 솔루션으로,
간단히 말해서 고성능의 빅코어와 저전력의
리틀코어를 조합하여
전력효율을 높이는 것입니다.

애플 역시 A10 Fusion 프로세서를
Apple Hurricane 기반 빅 클러스터 2코어,
Apple Zephyr 기반의 리틀 클러스터 2코어 조합으로 구성합니다.

하지만, 빅코어와 리틀코어를 동시에 사용하지 못했기 때문에 두 코어를 스위칭 해서
사용할 수밖에 없었는데, 쿼드코어 프로세서임에도 듀얼코어로 동작시켜야하는
웃지 못할 상황이 발생하기도 하였습니다.

하지만, 싱글코어 성능으로 엑시노스와 스냅드래곤을 압도하는 모습을 보여주면서
플래그쉽 모바일 디바이스 시장에서 강자의 자리를 굳히기도 했습니다.



머신러닝, 자체 아키텍쳐 그래픽. A11 Bionic

아이폰 8, 아이폰 8 Plus, 아이폰 X

A11 Bionic은 아이폰의 하드웨어가
전반적으로 크게 변화하면서
프로세서 역시 큰 변화가 있었는데요,
바로 인공신경망 프로세서(NPU)로 애플에서 자체개발한 Neural Engine을 탑재한
것입니다.

이 Neural Engine은 주로 머신러닝을
수행하는데,
여기서 머신러닝은 기계에게 정보를
'학습'시키는 것을 뜻합니다.
이를 통해 변수가 많거나,
인간이 일일히 규칙을 설정해 줄 수 없는 것
( ex)인공지능, 맞춤형 광고 etc... )
들에 대해 필요한 연산을 직접적으로 수행할 수 있게 됩니다.

아이폰 X에서 생긴 가장 큰 하드웨어적 변화로 Face ID가 추가 되었는데,
이 Neural Engine이 Face ID 얼굴인식을 위한 머신러닝을 효과적으로 수행합니다.

이 Neural Engine은 추후 사용범위가 확대되어 아이패드 프로에서 사진 편집/보정과 같은 작업 영역에도 사용됩니다.

이렇게 NPU를 따로 탑재해서 머신러닝을 기기 내부에서 사용하는 것은 아직도 애플이 다른
모바일 AP 제조사와 크게 차별화되는 점입니다.



그리고 이때부터 GPU 역시 자체 아키텍쳐로 제작하여 사용하기 시작합니다.
원래는 PowerVR의 GPU를 사용했지만,
이제는 CPU와 GPU 모두
애플이 설계하기 시작한 것이죠.



생태계 대통합. A12Z Bionic.

아이패드 프로 11형 2세대, 아이패드 프로 12.9형 4세대, Developer Transition Kit

A12Z 바이오닉.
사실 A12Z 자체가 그렇게 의미있는 프로세서는 아닙니다.
그냥 A12X에서 단순 그래픽 코어 하나만 더 활성화시킨 프로세서니까요.

일명 재고땡처리 프로세서라고나 할까요(...)

그럼에도 제가 이 프로세서를 따로 소개시켜드리는 이유는 바로 A12Z에서 ARM기반
macOS가 작동되기 때문입니다.

WWDC 2020에서 애플은 자사의 맥 제품군을 전부 ARM 기반의 애플 실리콘으로 이주할것을 발표합니다.

그러면서 아이패드 프로 4에 사용된
A12Z Bionic을 맥미니 폼팩터에 넣어서
Developer Transition Kit을 일부 배포하였는데요,

Source : Apple

이 키트에는 macOS Big Sur beta가
적용되었는데,
이때 모바일에서는 오래 전부터 굉장한 성능을 보여주고 있었던 애플 실리콘이
데스크탑에서도 꽤나 준수한 성능을 뽑아줄 수 있다는 사실을 보여주었습니다.

밴치마킹 점수 자체는 Geekbench 4 기준
i5 8400, Cinebench R23 기준
AMD Ryzen 5 2400G와 비슷비슷한 점수를 보여주었고,
GPU 성능은 엔비디아의 GT 1030과 비슷한 수준 정도로, 태블릿에 들어가는 프로세서가
일반 메인스트림 프로세서와 경쟁하는 기현상(?)을 보여준데다가,

WWDC 2020에서 4K 영상 여러개를 랜더링하고,
로제타 2를 이용하여 ARM 프로세서에 불리한 환경임에도 불구하고
섀도우 오브 툼 레이더를 1080p로 구동하면서 충격을 안겨주었습니다.



끝판왕. 괴물. 외계인고문, M1

맥북에어, 맥북프로 13인치, 맥미니, 아이맥 24인치, 아이패드 프로 11형 3세대, 아이패드 프로 12.9형 5세대

본격적으로 애플 실리콘의 무시무시한 성능을 우리에게 각인시켜준 프로세서죠.
M1입니다.

Apple Firestorm 4코어를 빅 클러스터로,
Apple Icestorm 4코어를 리틀 클러스터의
구성을 가지고 있는데, 이는 현용 CPU 역사상
가장 넓은 아키텍쳐에 속한다고 합니다.

Source : AnandTech


그 이유로 8-Wide 디코더 구조라는 것이 따로 있다고는 하는데....
...이게 설명이 따로 잘 되어있는 곳이 없더군요... 혹시나 따로 찾아보실 분들을 위해 아랫부분에 링크 남겨두겠습니다.

그냥 간단하게 말하면, 병렬 연산을 보다 빠르게 수행해 명령어를 빠르게 처리할 수 있고,
효율성을 높여서 성능 대비 전력소모를 효율적으로 줄일 수 있다고 생각하시면
되겠습니다.

여담이지만, 현재 ARM 레퍼런스 코어와 x86진영이 4-Wide 구조를 가진다고 합니다.

또한 M1은 엄청난 전성비로도 유명한데요,
빅 클러스터의 최대 전력소모량이 13.8W,
리틀 클러스터의 최대 전력 소모량이
1.3W로 동체급 인텔 코어가 20W로 동작할 때, M1은 코어당 4-5W 선에서 억제가
가능하게 되면서 인텔 프로세서에 비해 엄청난 전력효율을 보여줍니다.

또한 SoC패키지 안에 램이 통합됨으로써
CPU와 GPU간의 레이턴시를 현저히 줄여,
체급에 비해 엄청난 성능을 내도록 해 주었습니다.

GPU 성능은 GTX 1050Ti와 GTX 1650의
사이급에 해당하는 연산 성능을 가진 것으로
알려져 있으며, 이전 맥북 에어(인텔)보다 3배 더 빠르게 섀도우 오브 툼레이더를 구동할 수 있다 합니다.

CPU 성능은 싱글의 경우 Ryzen 9 5950X와 비슷한 점수를 보여주었고,
멀티의 경우에는 i5 10400, i7 1165G7과 비슷한 점수를 보여주면서
초저전력 프로세서에서 나올 수 없는 성능을 보여주자 인텔의 고성능 프로세서 뺨따구를
시원하게 갈겨버리고, '애플 외계인 고문설'이 다시 수면 위로 떠오르기도 했다죠....



 




이렇게 오늘은 오랜 기간 발전해 온 애플 실리콘에 대해서 알아보았는데요,
사실 에어팟이나 애플워치에 들어가는 U시리즈, S시리즈와 같은 칩셋도 있었지만,
애플 실리콘의 발전에 대해 이야기하려면
A와 M시리즈가 가장 적절하다고 판단되어서
A시리즈와 M시리즈를 중점적으로 소개를
해 드렸습니다.

애플 실리콘의 성능이 정말 좋은 것은 알고
있었지만,
약 10년 정도의 시간을 쭉 돌아보니, 그정도 기간안에 정말 무섭게 발전해온게 눈에 뛰더라구요...

앞으로 프로용 애플 실리콘인 가칭 'M1X'도 출시 예정인 만큼 애플이 반도체 시장을
어떻게 변화시킬지도 기대가 됩니다.

 

세희의 IT 블로그 : 네이버 블로그

잔머리신 강세희 블로그입니다.

blog.naver.com

반응형

댓글