게시일: 2025년 10월 21일
Gemini Nano로 구동되는 내장 AI 기능은 사용자와 개발자 모두에게 원활한 환경을 제공하도록 설계되었습니다. 기본 제공 AI API를 사용하면 모델 관리가 백그라운드에서 자동으로 이루어집니다. 이 문서에서는 Chrome에서 Gemini Nano 모델 다운로드, 업데이트, 삭제를 처리하는 방법을 설명합니다.
초기 모델 다운로드
사용자가 Chrome을 다운로드하거나 업데이트하면 Chrome에서 사용자의 하드웨어에 맞는 모델을 다운로드할 수 있도록 Gemini Nano가 온디맨드로 다운로드됩니다.
초기 모델 다운로드는 Gemini Nano에 종속된 내장 AI API의 *.create()
함수 (예: Summarizer.create()
)에 대한 첫 번째 호출에 의해 트리거됩니다. 이 경우 Chrome에서는 일련의 검사를 실행하여 최적의 조치를 결정합니다.
먼저 Chrome은 대표적인 셰이더를 실행하여 기기의 GPU 성능을 추정합니다. 이러한 결과를 바탕으로 다음 중 하나를 결정합니다.
- 더 큰 성능의 Gemini Nano 변형 (예: 4B 매개변수)을 다운로드합니다.
- 더 작고 효율적인 Gemini Nano 변형 (예: 2B 매개변수)을 다운로드합니다.
- 기기가 별도의 정적 요구사항을 충족하는 경우 CPU 기반 추론으로 대체 기기가 하드웨어 요구사항을 충족하지 않으면 모델이 다운로드되지 않습니다.
다운로드 프로세스는 복원력이 있도록 설계되었습니다.
- 인터넷 연결이 중단되면 연결이 복원된 후 중단된 부분부터 오프라인 저장이 계속됩니다.
- 다운로드를 트리거한 탭이 닫히면 다운로드가 백그라운드에서 계속됩니다.
- 브라우저가 닫히면 30일 이내에 브라우저를 열 때 다운로드가 다시 시작됩니다.
availability()
를 호출하면 모델 다운로드가 트리거되는 경우도 있습니다. 이는 새 사용자 프로필이 시작된 직후 통화가 발생하고 Gemini Nano 기반 사기 감지 기능이 활성화된 경우에 발생합니다.
LoRA 가중치 다운로드
일부 API(예: 교정기 API)는 기본 모델에 적용되어 기능을 전문화하는 LoRA(Low-Rank Adaptation) 가중치를 사용합니다. API가 LoRA에 종속된 경우 LoRA 가중치가 기본 모델과 함께 다운로드됩니다. 다른 API의 LoRA 가중치는 사전 다운로드되지 않습니다.
자동 모델 업데이트
Gemini Nano 모델 업데이트는 정기적으로 출시됩니다. Chrome은 브라우저가 시작될 때 이러한 업데이트를 확인합니다. 또한 Chrome은 LoRA 가중치와 같은 보조 리소스의 업데이트를 매일 확인합니다. JavaScript에서 프로그래매틱 방식으로 모델 버전을 쿼리할 수는 없지만 chrome://on-device-internals
에서 설치된 버전을 수동으로 확인할 수 있습니다.
업데이트 프로세스는 원활하고 중단되지 않도록 설계되었습니다.
- Chrome은 백그라운드에서 새 버전을 다운로드하는 동안 현재 모델로 계속 작동합니다.
- 업데이트된 모델이 다운로드되면 핫 스왑됩니다. 즉, 다운타임 없이 모델이 전환됩니다. 새 AI API 호출은 즉시 새 모델을 사용합니다. 참고: 스왑이 실행되는 정확한 순간에 실행되는 프롬프트는 실패할 수 있습니다.
- 모든 업데이트는 부분 다운로드가 아닌 전체 새 모델 다운로드입니다. 이는 버전 간 모델 가중치가 크게 다를 수 있고 이러한 대용량 파일의 델타를 계산하고 적용하는 데 시간이 오래 걸릴 수 있기 때문입니다.
업데이트에는 초기 다운로드와 동일한 요구사항이 적용됩니다. 하지만 모델이 이미 설치되어 있으면 초기 디스크 공간 확인이 면제됩니다. LoRA 가중치를 업데이트할 수도 있습니다. 기존 기본 모델에 새 버전의 LoRA 가중치를 적용할 수 있습니다. 하지만 새 기본 모델 버전에는 항상 새 LoRA 가중치가 필요합니다.
모델 삭제
Chrome은 사용자가 부족해지지 않도록 디스크 공간을 적극적으로 관리합니다. 기기의 여유 디스크 공간이 특정 기준점 아래로 떨어지면 Gemini Nano 모델이 자동으로 삭제됩니다. 또한 기업 정책에서 기능을 사용 중지하거나 사용자가 30일 동안 다른 자격 요건을 충족하지 않는 경우 모델이 삭제됩니다. 자격 요건에는 API 사용량과 기기 기능이 포함될 수 있습니다. 삭제 프로세스의 특징은 다음과 같습니다.
- 모델은 실행 중인 프롬프트와 관계없이 세션 중에도 언제든지 삭제할 수 있습니다. 즉, 세션 시작 시 사용할 수 있었던 API가 갑자기 사용할 수 없게 될 수 있습니다.
- 삭제된 후에는 모델이 자동으로 다시 다운로드되지 않습니다. 새 다운로드는
*.create()
함수를 호출하는 애플리케이션에 의해 트리거되어야 합니다. - 기본 모델이 삭제되면 30일의 유예 기간이 지난 후 관련 LoRA 가중치도 삭제됩니다.
모델 관리에서의 역할
내장 AI 모델의 수명 주기를 잘 이해하는 것은 사용자 환경을 올바르게 만드는 데 중요합니다. 모델을 한 번 다운로드하는 것으로 끝나는 것이 아니라 디스크 공간 압력으로 인해 모델이 갑자기 다시 사라질 가능성이나 새 버전이 출시될 때 모델이 업데이트될 가능성도 고려해야 합니다. 이 모든 것은 브라우저에서 처리합니다.
모델 다운로드에 관한 권장사항을 따르면 초기 다운로드, 재다운로드, 업데이트 시 적절한 사용자 환경을 만들 수 있습니다.