WebAssembly 가비지 컬렉션 (WasmGC)이 이제 Chrome에서 기본적으로 사용 설정됨

프로그래밍 언어에는 가비지 컬렉션 프로그래밍 언어와 수동 메모리 관리가 필요한 프로그래밍 언어, 이렇게 두 가지 유형이 있습니다. 전자의 예로는 Kotlin, PHP, 자바가 있습니다. 후자의 예로는 C, C++, Rust가 있습니다. 일반적으로 상위 레벨 프로그래밍 언어는 가비지 컬렉션을 표준 기능으로 사용할 가능성이 높습니다. 이 블로그 게시물에서는 가비지로 수집된 프로그래밍 언어와 이 언어를 WebAssembly (Wasm)에 컴파일하는 방법을 중점적으로 다룹니다. 하지만 가비지 컬렉션 (보통 GC라고도 함)은 무엇일까?

브라우저 지원

  • 119
  • 119
  • 120
  • x

가비지 컬렉션

간단히 말해 가비지 컬렉션이란 프로그램에 의해 할당되었지만 더 이상 참조되지 않는 메모리를 회수하려는 시도입니다. 이러한 메모리를 가비지라고 합니다. 가비지 컬렉션을 구현하기 위한 여러 가지 전략이 있습니다. 그중 하나는 참조 계산으로, 목표는 메모리의 객체에 대한 참조 수를 계산하는 것입니다. 객체에 대한 참조가 더 이상 없으면 객체를 더 이상 사용되지 않는 것으로 표시할 수 있으므로 가비지 컬렉션을 사용할 수 있습니다. PHP의 가비지 컬렉터는 참조 계산을 사용하며 Xdebug 확장 프로그램의 xdebug_debug_zval() 함수를 사용하면 자세히 살펴볼 수 있습니다. 다음 PHP 프로그램을 살펴보겠습니다.

<?php
  $a= (string) rand();
  $c = $b = $a;
  $b = 42;
  unset($c);
  $a = null;
?>

프로그램은 문자열로 변환된 랜덤 숫자를 a라는 새 변수에 할당합니다. 그런 다음 bc라는 새 변수 두 개를 만들고 a 값을 할당합니다. 그런 다음 b를 숫자 42에 재할당하고 c를 설정 해제합니다. 마지막으로 a의 값을 null로 설정합니다. 프로그램의 각 단계에 xdebug_debug_zval()로 주석을 달면 가비지 컬렉터의 참조 카운터가 작동하는 것을 볼 수 있습니다.

<?php
  $a= (string) rand();
  $c = $b = $a;
  xdebug_debug_zval('a');
  $b = 42;
  xdebug_debug_zval('a');
  unset($c);
  xdebug_debug_zval('a');
  $a = null;
  xdebug_debug_zval('a');
?>

위의 예시는 다음 로그를 출력합니다. 여기서 각 단계 후 변수 a 값의 참조 수가 어떻게 감소하는지 확인할 수 있습니다. 이는 코드 시퀀스를 고려했을 때 적합합니다. (당연히 랜덤 숫자는 다릅니다.)

a:
(refcount=3, is_ref=0)string '419796578' (length=9)
a:
(refcount=2, is_ref=0)string '419796578' (length=9)
a:
(refcount=1, is_ref=0)string '419796578' (length=9)
a:
(refcount=0, is_ref=0)null

가비지 컬렉션과 관련된 다른 문제(예: 주기 감지)도 있지만 이 문서에서는 참조 계산을 기본적인 수준으로 이해하는 것으로 충분합니다.

프로그래밍 언어가 다른 프로그래밍 언어로 구현됨

처음부터 시작된 것처럼 느껴질 수 있지만 프로그래밍 언어가 다른 프로그래밍 언어로 구현되어 있습니다. 예를 들어 PHP 런타임은 주로 C로 구현됩니다. GitHub의 PHP 소스 코드를 확인할 수 있습니다. PHP의 가비지 컬렉션 코드는 주로 zend_gc.c 파일에 있습니다. 대부분의 개발자는 운영체제의 패키지 관리자를 통해 PHP를 설치합니다. 하지만 개발자는 소스 코드에서 PHP를 빌드할 수도 있습니다. 예를 들어 Linux 환경에서는 ./buildconf && ./configure && make 단계를 따라 Linux 런타임용 PHP를 빌드합니다. 그러나 이는 아마도 Wasm과 같은 다른 런타임에 대해 PHP 런타임을 컴파일할 수 있다는 뜻이기도 합니다.

언어를 Wasm 런타임으로 포팅하는 기존 방법

PHP 스크립트는 PHP가 실행되는 플랫폼과 별개로 동일한 바이트 코드로 컴파일되며 Zend Engine에 의해 실행됩니다. Zend Engine은 PHP 스크립팅 언어를 위한 컴파일러이자 런타임 환경입니다. Zend Compiler와 Zend Executor로 구성된 Zend 가상 머신 (VM)으로 구성됩니다. C와 같은 다른 상위 수준 언어로 구현된 PHP와 같은 언어는 일반적으로 Intel 또는 ARM과 같은 특정 아키텍처를 대상으로 하는 최적화가 있으며 각 아키텍처에 다른 백엔드가 필요합니다. 이 맥락에서 Wasm은 새로운 아키텍처를 나타냅니다. VM에 JIT (Just-In-Time) 또는 AOT (Ahead-Of-Time) 컴파일과 같은 아키텍처별 코드가 있는 경우 개발자는 새 아키텍처에 JIT/AOT용 백엔드도 구현합니다. 코드베이스의 주요 부분을 각각의 새 아키텍처에 대해 다시 컴파일할 수 있는 경우가 많기 때문에 이 접근 방식이 합리적입니다.

낮은 수준의 Wasm을 감안할 때 동일한 접근 방식을 시도하는 것이 당연합니다. 파서, 라이브러리 지원, 가비지 컬렉션 및 옵티마이저를 사용하여 기본 VM 코드를 Wasm으로 다시 컴파일하고 필요한 경우 Wasm용 JIT 또는 AOT 백엔드를 구현합니다. Wasm MVP부터 이 방식을 사용할 수 있었으며 대부분의 경우 잘 작동합니다. 실제로 Wasm에 컴파일된 PHPWordPress 플레이그라운드의 기반입니다. WordPress 플레이그라운드 및 WebAssembly로 브라우저 내 WordPress 환경 빌드하기 도움말에서 프로젝트에 관해 자세히 알아보세요.

그러나 PHP Wasm은 호스트 언어 JavaScript의 컨텍스트에 따라 브라우저에서 실행됩니다. Chrome에서 ECMA-262에 명시된 대로 ECMAScript를 구현하는 Google의 오픈소스 JavaScript 엔진인 JavaScript 및 Wasm은 V8에서 실행됩니다. 또한 V8에 이미 가비지 컬렉터가 있습니다. 예를 들어, Wasm으로 컴파일된 PHP를 사용하는 개발자는 이식된 언어 (PHP)의 가비지 컬렉터 구현을 이미 가비지 컬렉터가 있는 브라우저에 전달하게 되며 이는 엄청난 낭비입니다. WasmGC가 필요한 이유가 바로 여기에 있습니다.

Wasm 모듈이 Wasm의 선형 메모리 위에 자체 GC를 빌드하도록 하는 기존의 접근 방식의 또 다른 문제는 Wasm의 자체 가비지 컬렉터와 컴파일된 Wasm 언어의 내장 가비지 컬렉터 간에 상호작용이 없으므로 메모리 누수 및 비효율적인 수집 시도와 같은 문제를 일으킬 수 있다는 점입니다. Wasm 모듈이 기존 내장 GC를 재사용하도록 허용하면 이러한 문제를 방지할 수 있습니다.

WasmGC를 사용하여 프로그래밍 언어를 새 런타임으로 포팅

WasmGC는 WebAssembly Community Group제안입니다. 현재 Wasm MVP 구현은 선형 메모리에서 정수와 부동 소수점 수인 숫자만 처리할 수 있으며 참조 유형 제안이 출시되면 Wasm은 외부 참조를 추가로 보유할 수 있습니다. 이제 WasmGC에서 구조체 및 배열 힙 유형을 추가합니다. 즉, 비선형 메모리 할당을 지원합니다. 각 WasmGC 객체의 유형과 구조가 고정되어 있으므로 VM이 자바스크립트와 같은 동적 언어의 최적화 해제 위험 없이 필드에 액세스할 수 있는 효율적인 코드를 쉽게 생성할 수 있습니다. 따라서 이 제안은 Wasm을 대상으로 하는 언어 컴파일러가 호스트 VM의 가비지 컬렉터와 통합할 수 있도록 하는 구조체 및 배열 힙 유형을 통해 WebAssembly에 높은 수준의 관리 언어를 위한 효율적인 지원을 추가합니다. 즉, WasmGC에서 프로그래밍 언어를 Wasm으로 포팅하면 프로그래밍 언어의 가비지 컬렉터가 더 이상 포트에 속할 필요가 없으며 대신 기존의 가비지 컬렉터를 사용할 수 있습니다.

이러한 개선사항이 실제로 미치는 영향을 확인하기 위해 Chrome의 Wasm팀은 C, Rust, Java에서 Fannkuch 벤치마크 (작동하면서 데이터 구조를 할당하는 버전)의 버전을 컴파일했습니다. C 및 Rust 바이너리는 다양한 컴파일러 플래그에 따라 6.1 K에서 9.6 K까지 다양할 수 있지만 자바 버전은 단 2.3 K로 훨씬 더 작습니다. C와 Rust에는 가비지 컬렉터가 포함되어 있지 않지만 메모리를 관리하기 위해 여전히 malloc/free를 번들로 묶습니다. 여기서 Java가 더 작은 이유는 메모리 관리 코드를 전혀 번들로 묶을 필요가 없기 때문입니다. 이는 구체적인 하나의 예일 뿐이지만 WasmGC 바이너리는 매우 작을 가능성이 있음을 보여주며, 이는 크기 최적화를 위한 중요한 작업을 시작하기 전입니다.

WasmGC 포트 프로그래밍 언어 실제 작동 보기

Kotlin Wasm

WasmGC 덕분에 Wasm으로 포팅된 첫 번째 프로그래밍 언어 중 하나는 Kotlin/Wasm의 형태의 Kotlin입니다. Kotlin팀에서 제공하는 소스 코드가 포함된 데모는 다음 목록에 나와 있습니다.

import kotlinx.browser.document
import kotlinx.dom.appendText
import org.w3c.dom.HTMLDivElement

fun main() {
    (document.getElementById("warning") as HTMLDivElement).style.display = "none"
    document.body?.appendText("Hello, ${greet()}!")
}

fun greet() = "world"

이제 요점이 무엇인지 궁금하실 것입니다. 위의 Kotlin 코드는 기본적으로 Kotlin으로 변환된 JavaScript OM API로 구성되어 있기 때문입니다. 개발자는 이미 Android Kotlin 앱을 위해 만든 UI를 기반으로 빌드할 수 있는 Compose Multiplatform과 함께 사용하면 더 합리적입니다. Kotlin/Wasm 이미지 뷰어 데모를 통해 이에 관한 초기 분석을 확인하고 소스 코드도 살펴보세요. 마찬가지로 Kotlin팀에서 제공해 드립니다.

Dart와 Flutter

Google의 Dart 및 Flutter팀도 WasmGC 지원을 준비하고 있습니다. Dart-to-Wasm 컴파일 작업은 거의 완료되었으며, 팀은 WebAssembly에 컴파일된 Flutter 웹 애플리케이션을 제공하기 위한 도구 지원 작업을 진행하고 있습니다. 작업의 현재 상태는 Flutter 문서에서 확인할 수 있습니다. 다음 데모는 Flutter WasmGC 미리보기입니다.

WasmGC 자세히 알아보기

이 블로그 게시물은 개략적인 것에 불과합니다. WasmGC의 대략적인 개요를 확인할 수 있습니다. 이 기능에 대해 자세히 알아보려면 다음 링크를 확인하세요.

감사의 말

UnsplashGary Chan의 히어로 이미지입니다. 이 자료는 Matthias Liedtke, Adam Klein, Joshua Bell, Alon Zakai, Jakob Kummerow, Clemens Backes, Emanuel Ziegler, Rachel Andrew Andrew가 작성한 글입니다.