WebAssembly 가비지 컬렉션 (WasmGC)이 이제 Chrome에서 기본적으로 사용 설정됨

프로그래밍 언어에는 가비지 컬렉션 프로그래밍 언어와 수동 메모리 관리가 필요한 프로그래밍 언어의 두 가지 유형이 있습니다. 전자의 예로는 Kotlin, PHP, Java 등이 있습니다. 후자의 예로는 C, C++, Rust가 있습니다. 일반적으로 상위 수준 프로그래밍 언어에는 가비지 컬렉션이 표준 기능으로 포함될 가능성이 더 높습니다. 이 블로그 게시물에서는 가비지로 수집된 프로그래밍 언어와 이러한 언어를 WebAssembly (Wasm)에 컴파일하는 방법을 중점적으로 살펴봅니다. 하지만 먼저 가비지 컬렉션 (GC라고도 함)이란 무엇일까요?

브라우저 지원

  • Chrome: 119
  • Edge: 119.
  • Firefox: 120
  • Safari: 지원되지 않음

가비지 컬렉션

간단히 말해 가비지 컬렉션은 프로그램에서 할당했지만 더 이상 참조되지 않는 메모리를 회수하려는 시도입니다. 이러한 메모리를 가비지라고 합니다. 가비지 수집을 구현하는 방법에는 여러 가지가 있습니다. 그중 하나는 참조 계산으로, 메모리에 있는 객체에 대한 참조 수를 계산하는 것이 목표입니다. 객체에 대한 참조가 더 이상 없으면 더 이상 사용되지 않는 것으로 표시하여 가비지 컬렉션을 준비할 수 있습니다. PHP의 가비지 컬렉터는 참조 수를 사용하며 Xdebug 확장 프로그램의 xdebug_debug_zval() 함수를 사용하면 내부 작동 방식을 살펴볼 수 있습니다. 다음 PHP 프로그램을 살펴보겠습니다.

<?php
  $a= (string) rand();
  $c = $b = $a;
  $b = 42;
  unset($c);
  $a = null;
?>

프로그램은 문자열로 변환된 임의의 숫자를 a라는 새 변수에 할당합니다. 그런 다음 두 개의 새 변수 bc를 만들고 a 값을 할당합니다. 그런 다음 b를 숫자 42에 재할당한 다음 c를 설정 해제합니다. 마지막으로 a 값을 null로 설정합니다. 프로그램의 각 단계에 xdebug_debug_zval()로 주석을 달면 가비지 컬렉터의 참조 카운터가 작동하는 것을 볼 수 있습니다.

<?php
  $a= (string) rand();
  $c = $b = $a;
  xdebug_debug_zval('a');
  $b = 42;
  xdebug_debug_zval('a');
  unset($c);
  xdebug_debug_zval('a');
  $a = null;
  xdebug_debug_zval('a');
?>

위 예에서는 다음 로그가 출력됩니다. 여기서 각 단계 후에 a 변수 값에 대한 참조 수가 어떻게 감소하는지 확인할 수 있습니다. 이는 코드 시퀀스를 고려할 때 당연한 결과입니다. 물론 임의의 숫자는 다를 것입니다.

a:
(refcount=3, is_ref=0)string '419796578' (length=9)
a:
(refcount=2, is_ref=0)string '419796578' (length=9)
a:
(refcount=1, is_ref=0)string '419796578' (length=9)
a:
(refcount=0, is_ref=0)null

가비지 컬렉션과 관련된 다른 문제(예: 주기 감지)가 있지만 이 도움말에는 참조 계산에 대한 기본적인 수준의 이해가 필요합니다.

프로그래밍 언어는 다른 프로그래밍 언어로 구현됩니다.

초창기라고 생각할 수도 있지만, 프로그래밍 언어는 다른 프로그래밍 언어로 구현됩니다. 예를 들어 PHP 런타임은 주로 C로 구현됩니다. GitHub에서 PHP 소스 코드를 확인할 수 있습니다. PHP의 가비지 컬렉션 코드는 주로 zend_gc.c 파일에 있습니다. 대부분의 개발자는 운영체제의 패키지 관리자를 통해 PHP를 설치합니다. 하지만 개발자가 소스 코드에서 PHP를 빌드할 수도 있습니다. 예를 들어 Linux 환경에서 ./buildconf && ./configure && make 단계는 Linux 런타임용 PHP를 빌드합니다. 하지만 PHP 런타임은 Wasm과 같은 다른 런타임용으로 컴파일될 수도 있습니다.

Wasm 런타임으로 언어를 포팅하는 기존 방법

PHP가 실행되는 플랫폼과 관계없이 PHP 스크립트는 동일한 바이트 코드로 컴파일되고 Zend 엔진에서 실행됩니다. Zend 엔진은 PHP 스크립팅 언어의 컴파일러 및 런타임 환경입니다. Zend 가상 머신 (VM)은 Zend 컴파일러와 Zend Executor로 구성됩니다. C와 같은 다른 고급 언어로 구현된 PHP와 같은 언어에는 일반적으로 Intel 또는 ARM과 같은 특정 아키텍처를 타겟팅하는 최적화가 있으며 아키텍처마다 다른 백엔드가 필요합니다. 이 맥락에서 Wasm은 새로운 아키텍처를 나타냅니다. VM에 JIT (Just-In-Time) 또는 AOT (Ahead-Of-Time) 컴파일과 같은 아키텍처별 코드가 있는 경우 개발자는 새 아키텍처의 JIT/AOT용 백엔드도 구현합니다. 코드베이스의 주요 부분을 각각의 새 아키텍처에 대해 재컴파일할 수 있는 경우가 많기 때문에 이 접근 방식은 합리적입니다.

Wasm이 얼마나 하위 수준인지를 고려할 때 동일한 접근 방식을 시도하는 것이 자연스럽습니다. 파서, 라이브러리 지원, 가비지 컬렉션, 최적화 도구가 포함된 기본 VM 코드를 Wasm으로 다시 컴파일하고 필요한 경우 Wasm용 JIT 또는 AOT 백엔드를 구현합니다. 이는 Wasm MVP 이후로 가능해졌으며, 많은 경우 실제로 잘 작동합니다. 실제로 WordPress 플레이그라운드Wasm으로 컴파일된 PHP를 기반으로 합니다. WordPress 플레이그라운드 및 WebAssembly로 브라우저 내 WordPress 환경 빌드 도움말에서 프로젝트에 대해 자세히 알아보세요.

그러나 PHP Wasm은 호스트 언어 JavaScript의 컨텍스트에서 브라우저에서 실행됩니다. Chrome에서는 ECMA-262에 지정된 대로 ECMAScript를 구현하는 Google의 오픈소스 JavaScript 엔진인 V8에서 JavaScript와 Wasm이 실행됩니다. V8에는 이미 가비지 컬렉터가 있습니다. 즉, 예를 들어 Wasm으로 컴파일된 PHP를 사용하는 개발자는 이미 가비지 컬렉터가 있는 브라우저에 포팅된 언어 (PHP)의 가비지 컬렉터 구현을 제공하게 되며, 이는 생각만큼이나 낭비가 심합니다. 이때 WasmGC가 사용됩니다.

Wasm 모듈이 Wasm의 선형 메모리 위에 자체 GC를 빌드하도록 하는 기존 접근 방식의 또 다른 문제는 Wasm 자체 가비지 컬렉터와 Wasm으로 컴파일된 언어의 빌드된 가비지 컬렉터 간에 상호작용이 없다는 것입니다. 이로 인해 메모리 누수 및 비효율적인 수집 시도와 같은 문제가 발생하는 경향이 있습니다. Wasm 모듈이 기존 내장 GC를 재사용하도록 하면 이러한 문제가 방지됩니다.

WasmGC를 사용하여 프로그래밍 언어를 새 런타임으로 포팅

WasmGC는 WebAssembly 커뮤니티 그룹제안서입니다. 현재 Wasm MVP 구현은 선형 메모리에서 숫자(즉, 정수 및 부동 소수점 수)만 처리할 수 있으며, 참조 유형 제안서가 제공되면 Wasm은 외부 참조도 보유할 수 있습니다. WasmGC가 이제 구조체 및 배열 힙 유형을 추가하므로 비선형 메모리 할당이 지원됩니다. 각 WasmGC 객체는 고정된 유형과 구조를 가지므로 VM은 JavaScript와 같은 동적 언어에서 발생하는 역 최적화 위험 없이 필드에 액세스하는 효율적인 코드를 쉽게 생성할 수 있습니다. 따라서 이 제안서에서는 Wasm을 타겟팅하는 언어 컴파일러가 호스트 VM의 가비지 컬렉터와 통합할 수 있도록 하는 구조체 및 배열 힙 유형을 통해 WebAssembly에 고급 관리형 언어를 효율적으로 지원합니다. 간단히 말해 WasmGC를 사용하면 프로그래밍 언어를 Wasm으로 포팅한다는 것은 프로그래밍 언어의 가비지 컬렉터가 더 이상 포트에 속할 필요가 없고 대신 기존 가비지 컬렉터를 사용할 수 있음을 의미합니다.

이러한 개선사항이 실제로 미치는 영향을 확인하기 위해 Chrome의 Wasm팀은 C, Rust, Java에서 Fannkuch 벤치마크 버전 (작동하는 대로 데이터 구조를 할당함)을 컴파일했습니다. C 및 Rust 바이너리는 다양한 컴파일러 플래그에 따라 6.1K~9.6K일 수 있지만 Java 버전은 2.3K로 훨씬 작습니다. C 및 Rust에는 가비지 컬렉터가 포함되어 있지 않지만 메모리를 관리하기 위해 여전히 malloc/free를 번들로 제공합니다. 여기서 Java가 더 작은 이유는 메모리 관리 코드를 전혀 번들로 묶을 필요가 없기 때문입니다. 이는 하나의 구체적인 예에 불과하지만 WasmGC 바이너리가 매우 작을 가능성이 있음을 보여줍니다. 이는 크기 최적화에 대한 중요한 작업 전에도 마찬가지입니다.

WasmGC로 포팅된 프로그래밍 언어 실행 보기

Kotlin Wasm

WasmGC 덕분에 Wasm으로 포팅된 최초의 프로그래밍 언어 중 하나는 Kotlin/Wasm 형태의 Kotlin입니다. Kotlin팀에서 제공한 소스 코드가 포함된 데모는 다음 목록에 나와 있습니다.

import kotlinx.browser.document
import kotlinx.dom.appendText
import org.w3c.dom.HTMLDivElement

fun main() {
    (document.getElementById("warning") as HTMLDivElement).style.display = "none"
    document.body?.appendText("Hello, ${greet()}!")
}

fun greet() = "world"

위의 Kotlin 코드는 기본적으로 Kotlin으로 변환된 JavaScript OM API로 구성되어 있으므로 이 코드의 의미가 무엇인지 궁금할 수 있습니다. 개발자가 이미 Android Kotlin 앱용으로 만든 UI를 기반으로 빌드할 수 있는 Compose Multiplatform과 함께 사용하면 더욱 타당해지기 시작합니다. Kotlin/Wasm 이미지 뷰어 데모를 통해 이 기능을 미리 살펴보고 Kotlin팀에서 제공하는 소스 코드도 살펴보세요.

Dart 및 Flutter

Google의 Dart 및 Flutter팀도 WasmGC 지원을 준비하고 있습니다. Dart-to-Wasm 컴파일 작업은 거의 완료되었고 팀은 WebAssembly로 컴파일된 Flutter 웹 애플리케이션을 제공하기 위한 도구 지원을 담당하고 있습니다. 작업의 현재 상태는 Flutter 문서에서 확인할 수 있습니다. 다음 데모는 Flutter WasmGC 미리보기입니다.

WasmGC 자세히 알아보기

이 블로그 게시물에서는 WasmGC에 대해 간단히 살펴보고 대략적인 개요를 제공했습니다. 이 기능에 대해 자세히 알아보려면 다음 링크를 확인하세요.

감사의 말씀

이 도움말은 Matthias Liedtke, Adam Klein, Joshua Bell, Alon Zakai, Jakob Kummerow, Clemens Backes, Emanuel Ziegler, Rachel Andrew가 검토했습니다.