프로그래밍 언어에는 가비지 수집 프로그래밍 언어와 수동 메모리 관리가 필요한 프로그래밍 언어의 두 가지 유형이 있습니다. 전자의 예로는 Kotlin, PHP, Java 등이 있습니다. 후자의 예로는 C, C++, Rust가 있습니다. 일반적으로 고급 프로그래밍 언어에는 가비지 수집이 표준 기능으로 포함되어 있습니다. 이 블로그 게시물에서는 가비지 수집 프로그래밍 언어와 이러한 언어를 WebAssembly (Wasm)로 컴파일하는 방법에 중점을 둡니다. 하지만 가비지 컬렉션 (GC라고도 함)이란 무엇일까요?
Browser Support
가비지 컬렉션
간단히 말해 가비지 컬렉션은 프로그램에서 할당했지만 더 이상 참조되지 않는 메모리를 회수하려는 시도입니다. 이러한 메모리를 가비지라고 합니다. 가비지 컬렉션을 구현하는 전략은 다양합니다. 그중 하나는 메모리에 있는 객체에 대한 참조 수를 세는 것을 목표로 하는 참조 계산입니다. 객체에 대한 참조가 더 이상 없으면 더 이상 사용되지 않는 것으로 표시되어 가비지 컬렉션을 준비할 수 있습니다. PHP의 가비지 컬렉터는 참조 카운팅을 사용하며 Xdebug 확장 프로그램의 xdebug_debug_zval()
함수를 사용하면 내부를 살펴볼 수 있습니다. 다음 PHP 프로그램을 고려해 보세요.
<?php
$a= (string) rand();
$c = $b = $a;
$b = 42;
unset($c);
$a = null;
?>
프로그램은 문자열로 변환된 난수를 a
라는 새 변수에 할당합니다. 그런 다음 b
및 c
이라는 두 개의 새 변수를 만들어 a
값을 할당합니다. 그런 다음 b
를 숫자 42
에 다시 할당하고 c
를 설정 해제합니다. 마지막으로 a
값을 null
로 설정합니다. 프로그램의 각 단계를 xdebug_debug_zval()
로 주석 처리하면 가비지 수집기의 참조 카운터가 작동하는 것을 확인할 수 있습니다.
<?php
$a= (string) rand();
$c = $b = $a;
xdebug_debug_zval('a');
$b = 42;
xdebug_debug_zval('a');
unset($c);
xdebug_debug_zval('a');
$a = null;
xdebug_debug_zval('a');
?>
위의 예에서는 다음 로그가 출력됩니다. 코드 시퀀스를 고려할 때 변수 a
의 값에 대한 참조 수가 각 단계 후에 감소하는 것을 확인할 수 있습니다. (물론 무작위 숫자는 다를 수 있습니다.)
a:
(refcount=3, is_ref=0)string '419796578' (length=9)
a:
(refcount=2, is_ref=0)string '419796578' (length=9)
a:
(refcount=1, is_ref=0)string '419796578' (length=9)
a:
(refcount=0, is_ref=0)null
사이클 감지와 같은 가비지 컬렉션의 다른 문제도 있지만 이 도움말에서는 참조 수에 대한 기본적인 이해만 있으면 됩니다.
프로그래밍 언어는 다른 프로그래밍 언어로 구현됩니다.
인셉션처럼 느껴질 수 있지만 프로그래밍 언어는 다른 프로그래밍 언어로 구현됩니다. 예를 들어 PHP 런타임은 주로 C로 구현됩니다. GitHub에서 PHP 소스 코드를 확인할 수 있습니다. PHP의 가비지 컬렉션 코드는 주로 zend_gc.c
파일에 있습니다. 대부분의 개발자는 운영체제의 패키지 관리자를 통해 PHP를 설치합니다. 하지만 개발자는 소스 코드에서 PHP를 빌드할 수도 있습니다. 예를 들어 Linux 환경에서 ./buildconf && ./configure && make
단계를 실행하면 Linux 런타임용 PHP가 빌드됩니다. 하지만 이는 PHP 런타임을 Wasm과 같은 다른 런타임용으로 컴파일할 수 있다는 의미이기도 합니다.
언어를 Wasm 런타임으로 포팅하는 기존 방법
PHP가 실행되는 플랫폼과 관계없이 PHP 스크립트는 동일한 바이트 코드로 컴파일되고 Zend Engine에 의해 실행됩니다. Zend Engine은 PHP 스크립트 언어의 컴파일러이자 런타임 환경입니다. Zend 컴파일러와 Zend 실행기로 구성된 Zend 가상 머신 (VM)으로 구성됩니다. C와 같은 다른 고급 언어로 구현된 PHP와 같은 언어에는 일반적으로 Intel 또는 ARM과 같은 특정 아키텍처를 타겟팅하는 최적화가 있으며 각 아키텍처에 다른 백엔드가 필요합니다. 이 맥락에서 Wasm은 새로운 아키텍처를 나타냅니다. VM에 JIT (Just-In-Time) 또는 AOT (Ahead-Of-Time) 컴파일과 같은 아키텍처별 코드가 있는 경우 개발자는 새 아키텍처의 JIT/AOT 백엔드도 구현합니다. 이 접근 방식은 코드베이스의 기본 부분이 각 새 아키텍처에 대해 다시 컴파일될 수 있는 경우가 많기 때문에 매우 합리적입니다.
Wasm이 얼마나 하위 수준인지 고려할 때 동일한 접근 방식을 시도하는 것이 자연스럽습니다. 파서, 라이브러리 지원, 가비지 컬렉션, 최적화 프로그램이 포함된 기본 VM 코드를 Wasm으로 재컴파일하고 필요한 경우 Wasm용 JIT 또는 AOT 백엔드를 구현합니다. 이는 Wasm MVP 이후로 가능해졌으며 실제로 많은 경우에 잘 작동합니다. 실제로 Wasm으로 컴파일된 PHP는 WordPress Playground를 지원합니다. WordPress Playground 및 WebAssembly로 브라우저 내 WordPress 환경 빌드 도움말에서 프로젝트에 대해 자세히 알아보세요.
하지만 PHP Wasm은 호스트 언어 JavaScript의 컨텍스트에서 브라우저에서 실행됩니다. Chrome에서 JavaScript와 Wasm은 V8에서 실행됩니다. V8은 ECMA-262에 명시된 대로 ECMAScript를 구현하는 Google의 오픈소스 JavaScript 엔진입니다. 또한 V8에는 이미 가비지 컬렉터가 있습니다. 즉, Wasm으로 컴파일된 PHP를 사용하는 개발자는 이미 가비지 수집기가 있는 브라우저에 포팅된 언어 (PHP)의 가비지 수집기 구현을 제공하게 되며, 이는 낭비입니다. 이때 WasmGC가 사용됩니다.
Wasm 모듈이 Wasm의 선형 메모리 위에 자체 GC를 빌드하도록 허용하는 이전 방식의 또 다른 문제는 Wasm 자체 가비지 수집기와 Wasm으로 컴파일된 언어의 빌드된 가비지 수집기 간에 상호작용이 없다는 것입니다. 이로 인해 메모리 누수 및 비효율적인 수집 시도와 같은 문제가 발생하는 경향이 있습니다. Wasm 모듈이 기존 내장 GC를 재사용하도록 하면 이러한 문제를 방지할 수 있습니다.
WasmGC를 사용하여 프로그래밍 언어를 새 런타임으로 포팅
WasmGC는 WebAssembly Community Group의 제안입니다. 현재 Wasm MVP 구현은 선형 메모리에서 숫자, 즉 정수와 부동 소수점만 처리할 수 있으며 참조 유형 제안이 제공됨에 따라 Wasm은 외부 참조도 보유할 수 있습니다. 이제 WasmGC는 구조체 및 배열 힙 유형을 추가하므로 비선형 메모리 할당이 지원됩니다. 각 WasmGC 객체에는 고정된 유형과 구조가 있으므로 VM이 JavaScript와 같은 동적 언어에 있는 최적화 해제 위험 없이 필드에 액세스하는 효율적인 코드를 쉽게 생성할 수 있습니다. 따라서 이 제안은 언어 컴파일러가 호스트 VM의 가비지 수집기와 통합될 수 있도록 하는 구조체 및 배열 힙 유형을 통해 WebAssembly에 고급 관리 언어를 효율적으로 지원합니다. 간단히 말해 WasmGC를 사용하면 프로그래밍 언어를 Wasm으로 포팅할 때 프로그래밍 언어의 가비지 컬렉터가 더 이상 포트의 일부일 필요가 없으며 기존 가비지 컬렉터를 대신 사용할 수 있습니다.
이 개선사항의 실제 영향을 확인하기 위해 Chrome의 Wasm팀은 C, Rust, Java에서 Fannkuch 벤치마크 (작동 시 데이터 구조를 할당함) 버전을 컴파일했습니다. C 및 Rust 바이너리는 다양한 컴파일러 플래그에 따라 6.1K에서 9.6K까지 다양하지만 Java 버전은 2.3K에 불과합니다. C와 Rust에는 가비지 수집기가 포함되어 있지 않지만 메모리를 관리하기 위해 malloc/free
를 번들로 묶습니다. Java가 여기에서 더 작은 이유는 메모리 관리 코드를 전혀 번들로 묶을 필요가 없기 때문입니다. 이는 하나의 구체적인 예일 뿐이지만 WasmGC 바이너리가 매우 작을 수 있음을 보여줍니다. 이는 크기 최적화에 대한 상당한 작업이 이루어지기 전의 결과입니다.
WasmGC 포팅 프로그래밍 언어의 작동 방식 확인
Kotlin Wasm
WasmGC 덕분에 Wasm으로 포팅된 최초의 프로그래밍 언어 중 하나는 Kotlin/Wasm 형태의 Kotlin입니다. Kotlin팀에서 제공한 소스 코드가 포함된 데모는 다음 목록에 표시되어 있습니다.
import kotlinx.browser.document
import kotlinx.dom.appendText
import org.w3c.dom.HTMLDivElement
fun main() {
(document.getElementById("warning") as HTMLDivElement).style.display = "none"
document.body?.appendText("Hello, ${greet()}!")
}
fun greet() = "world"
위의 Kotlin 코드는 기본적으로 Kotlin으로 변환된 JavaScript OM API로 구성되어 있으므로 그 이유가 궁금할 수 있습니다. 개발자가 Android Kotlin 앱을 위해 이미 만든 UI를 기반으로 빌드할 수 있는 Compose 멀티플랫폼과 함께 사용하면 더욱 유용합니다. Kotlin 팀에서 제공하는 Kotlin/Wasm 이미지 뷰어를 통해 이 기능을 미리 살펴볼 수 있습니다.
Dart 및 Flutter
Google의 Dart 및 Flutter팀에서도 WasmGC 지원을 준비하고 있습니다. Dart-to-Wasm 컴파일 작업이 거의 완료되었으며, 팀은 WebAssembly로 컴파일된 Flutter 웹 애플리케이션을 제공하기 위한 도구 지원 작업을 진행하고 있습니다. 작업의 현재 상태는 Flutter 문서에서 확인할 수 있습니다. 다음 데모는 Flutter WasmGC 미리보기입니다.
WasmGC에 대해 자세히 알아보기
이 블로그 게시물에서는 WasmGC에 대해 개략적으로만 설명했습니다. 이 기능에 대해 자세히 알아보려면 다음 링크를 확인하세요.
감사의 말씀
이 도움말은 마티아스 리드케, 아담 클라인, 조슈아 벨, 알론 자카이, 야코브 쿠머로, 클레멘스 바케스, 에마누엘 지글러, 레이첼 앤드류가 검토했습니다.