Эксперименты с подгруппами
Функция подгрупп обеспечивает параллелизм на уровне SIMD, позволяя потокам внутри группы взаимодействовать и выполнять коллективные математические операции (например, вычислять сумму 16 чисел). Это обеспечивает высокоэффективную форму обмена данными между потоками.
Минимальная реализация предложения подгрупп доступна для локального тестирования с флагом «Unsafe WebGPU Support» по адресу chrome://flags/#enable-unsafe-webgpu
.
Вы также можете попробовать создать на своём сайте подгруппы с реальными пользователями, зарегистрировавшись на пробную версию Origin . Инструкции по подготовке сайта к использованию пробных версий Origin см. в статье «Начало работы с пробными версиями Origin». Пробная версия Origin будет действовать с Chrome 128 по 131 (до 19 февраля 2025 г.). См. раздел «Намерение экспериментировать» .
Если функция "subgroups"
доступна в GPUAdapter
, запросите GPUDevice
с этой функцией, чтобы получить поддержку подгрупп в WGSL и проверить ее ограничения minSubgroupSize
и maxSubgroupSize
.
Вам также необходимо явно включить это расширение в коде WGSL с помощью enable subgroups;
При включении вы получаете доступ к следующим дополнениям:
-
subgroup_invocation_id
: встроенное значение индекса потока внутри подгруппы. -
subgroup_size
: встроенное значение для доступа к размеру подгруппы. -
subgroupBallot(value)
: возвращает набор битовых полей, где бит, соответствующийsubgroup_invocation_id
, равен 1, еслиvalue
равно true для этого активного вызова, и 0 в противном случае. -
subgroupBroadcast(value, id)
: транслируетvalue
из вызова сsubgroup_invocation_id
, соответствующимid
, всем вызовам внутри подгруппы. Примечание:id
должен быть константой времени компиляции.
В будущем будут добавлены дополнительные встроенные функции, такие как subgroupAdd
, subgroupAll
, subgroupElect
и subgroupShuffle
. См. issue 354738715 .
Чтобы разрешить f16 в операциях с подгруппами, запросите GPUDevice
с функциями "subgroups"
, "subgroups-f16"
и "shader-f16"
, а затем включите его в коде WGSL с помощью enable f16, subgroups, subgroups_f16;
Следующий фрагмент кода предоставляет основу для экспериментов и раскрытия потенциала подгрупп.
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("subgroups")) {
throw new Error("Subgroups support is not available");
}
// Explicitly request subgroups support.
const device = await adapter.requestDevice({
requiredFeatures: ["subgroups"],
});
const shaderModule = device.createShaderModule({ code: `
enable subgroups;
var<workgroup> wgmem : u32;
@group(0) @binding(0)
var<storage, read> inputs : array<u32>;
@group(0) @binding(1)
var<storage, read_write> output : array<u32>;
@compute @workgroup_size(64)
fn main(@builtin(subgroup_size) subgroupSize : u32,
@builtin(subgroup_invocation_id) id : u32,
@builtin(local_invocation_index) lid : u32) {
// One thread per workgroup writes the value to workgroup memory.
if (lid == 0) {
wgmem = inputs[lid];
}
workgroupBarrier();
var v = 0u;
// One thread per subgroup reads the value from workgroup memory
// and shares that value with every other thread in the subgroup
// to reduce local memory bandwidth.
if (id == 0) {
v = wgmem;
}
v = subgroupBroadcast(v, 0);
output[lid] = v;
}`,
});
// Send the appropriate commands to the GPU...
Отменить настройку смещения глубины для линий и точек
Изменение спецификации WebGPU приводит к тому, что установка ненулевых значений для параметров depthBias
, depthBiasSlopeScale
и depthBiasClamp
при топологии конвейера рендеринга линейного или точечного типа приводит к ошибке валидации. Чтобы дать разработчикам достаточно времени для обновления кода, в консоли DevTools отображается предупреждение о предстоящей валидации, а также принудительно устанавливаются нулевые значения в таких случаях. См. issue 352567424 .
Скрыть предупреждение DevTools об ошибке, если preventDefault
В консоли DevTools предупреждения о событиях uncapturederror
больше не отображаются, если зарегистрирован прослушиватель событий uncapturederror
и в обратном вызове прослушивателя событий был вызван метод Event preventDefault()
. Это поведение соответствует обработке событий в JavaScript. См. следующий пример и ошибку 40263619 .
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
device.addEventListener("uncapturederror", (event) => {
// Prevents browser warning to show up in the DevTools Console.
event.preventDefault();
// TODO: Handle event.error
});
WGSL сначала интерполирует выборку, а затем либо
Атрибут WGSL interpolate
позволяет управлять пользовательской интерполяцией данных ввода-вывода. Теперь новые параметры выборки interpolate first
(по умолчанию) и either
предоставляют дополнительный контроль: first
использует значение из первой вершины примитива, а either
допускает либо первую, либо последнюю вершину. См. issue 340278447 .
Обновления Dawn
Реализация WGPUFuture в Dawn для обработки асинхронных операций завершена. Ключевые концепции включают wgpuInstanceProcessEvents для оппортунистической обработки событий и WGPUCallbackMode для определения точек обратного вызова. WGPUFuture обозначает одноразовые события с бесконечным временем существования, а wgpuInstanceWaitAny ожидает завершения любого будущего события или истечения времени ожидания. См. issue 42240932 .
Значение CompositeAlphaMode::Auto
теперь не возвращается функцией Surface::GetCapabilities()
. Оно по-прежнему допустимо и эквивалентно Surface::GetCapabilities().alphaMode[0]
. См. проблему 292 .
Бэкэнд OpenGL теперь поддерживает Surface
с y-flip-переворотом для каждого вызова Present()
. См . issue 344814083 .
Метод Adapter::GetProperties()
устарел, вместо него используется Adapter::GetInfo()
.
Джасвант, внешний участник, переписал все файлы CMake, упростив их обновление и сделав возможным предварительную сборку. Ознакомьтесь с кратким руководством по использованию Dawn в проектах CMake.
Здесь рассматриваются лишь некоторые из ключевых моментов. Ознакомьтесь с полным списком коммитов .
Что нового в WebGPU
Список всего, что было рассмотрено в серии « Что нового в WebGPU» .
Хром 140
- Запросы устройств потребляют адаптер
- Сокращенное обозначение использования текстуры там, где используется вид текстуры
- WGSL textureSampleLevel поддерживает одномерные текстуры
- Отменить использование текстур хранилища bgra8unorm только для чтения
- Удалить атрибут GPUAdapter isFallbackAdapter
- Обновления Dawn
Хром 139
- Поддержка 3D-текстур для сжатых форматов BC и ASTC
- Новая функция «основные функции и ограничения»
- Пробная версия Origin для режима совместимости с WebGPU
- Обновления Dawn
Хром 138
- Сокращение для использования буфера в качестве связующего ресурса
- Изменения требований к размеру буферов, отображаемых при создании
- Отчет об архитектуре последних графических процессоров
- Отменить атрибут GPUAdapter isFallbackAdapter
- Обновления Dawn
Хром 137
- Использовать вид текстуры для привязки externalTexture
- Буферы копируются без указания смещения и размера
- WGSL workgroupUniformLoad с использованием указателя на атомарный
- Атрибут powerPreference GPUAdapterInfo
- Удалить атрибут совместимости GPURequestAdapterOptions
- Обновления Dawn
Хром 136
- GPUAdapterInfo — атрибут FallbackAdapter
- Улучшение времени компиляции шейдера на D3D12
- Сохраняйте и копируйте изображения холста
- Ограничения режима совместимости
- Обновления Dawn
Хром 135
- Разрешить создание макета конвейера с макетом группы нулевых привязок
- Разрешить областям просмотра выходить за границы целевых объектов рендеринга
- Более простой доступ к экспериментальному режиму совместимости на Android
- Удалить ограничение maxInterStageShaderComponents
- Обновления Dawn
Хром 134
- Улучшите рабочие нагрузки машинного обучения с помощью подгрупп
- Удалить поддержку плавающих фильтруемых текстур как смешиваемых.
- Обновления Dawn
Хром 133
- Дополнительные форматы вершин unorm8x4-bgra и 1-компонентные
- Разрешить запрашивать неизвестные лимиты с неопределенным значением
- Изменения правил выравнивания WGSL
- Повышение производительности WGSL за счет отмены
- Используйте VideoFrame displaySize для внешних текстур
- Обработка изображений с ориентацией, отличной от стандартной, с помощью copyExternalImageToTexture
- Улучшение опыта разработчиков
- Включить режим совместимости с featureLevel
- Экспериментальная подгруппа функций очистки
- Отменить ограничение maxInterStageShaderComponents
- Обновления Dawn
Хром 132
- Использование вида текстуры
- Смешивание 32-битных плавающих текстур
- Атрибут GPUDevice adapterInfo
- Настройка контекста холста с недопустимым форматом приводит к ошибке JavaScript
- Фильтрация ограничений сэмплера на текстуры
- Расширенные эксперименты с подгруппами
- Улучшение опыта разработчиков
- Экспериментальная поддержка 16-битных нормализованных форматов текстур
- Обновления Dawn
Хром 131
- Расстояния клипов в WGSL
- GPUCanvasContext getConfiguration()
- Точечные и линейные примитивы не должны иметь смещения глубины.
- Встроенные функции сканирования для подгрупп
- Экспериментальная поддержка многоразового косвенного вывода
- Опция компиляции модуля шейдера строгая математика
- Удалить GPUAdapter requestAdapterInfo()
- Обновления Dawn
Хром 130
- Смешивание двух источников
- Улучшение времени компиляции шейдеров на Metal
- Устаревание GPUAdapter requestAdapterInfo()
- Обновления Dawn
Хром 129
- Поддержка HDR с режимом тональной компрессии на холсте
- Расширенная поддержка подгрупп
- Обновления Dawn
Хром 128
- Эксперименты с подгруппами
- Отменить настройку смещения глубины для линий и точек
- Скрыть предупреждение DevTools об ошибке, если preventDefault
- WGSL сначала интерполирует выборку, а затем либо
- Обновления Dawn
Хром 127
- Экспериментальная поддержка OpenGL ES на Android
- Атрибут информации GPUAdapter
- Улучшения взаимодействия с WebAssembly
- Улучшены ошибки кодировщика команд
- Обновления Dawn
Хром 126
- Увеличить лимит maxTextureArrayLayers
- Оптимизация загрузки буфера для бэкэнда Vulkan
- Улучшение времени компиляции шейдера
- Отправленные буферы команд должны быть уникальными.
- Обновления Dawn
Хром 125
Хром 124
- Текстуры хранения данных, доступные только для чтения и для чтения и записи
- Поддержка работников сферы услуг и коллективных работников
- Новые атрибуты информации об адаптере
- Исправления ошибок
- Обновления Dawn
Хром 123
- Поддержка встроенных функций DP4a в WGSL
- Неограниченные параметры указателя в WGSL
- Синтаксический сахар для разыменования композитов в WGSL
- Отдельное состояние «только для чтения» для аспектов трафарета и глубины
- Обновления Dawn
Хром 122
- Расширение охвата с помощью режима совместимости (функция в разработке)
- Увеличить лимит maxVertexAttributes
- Обновления Dawn
Хром 121
- Поддержка WebGPU на Android
- Используйте DXC вместо FXC для компиляции шейдеров в Windows
- Запросы временных меток в проходах вычислений и рендеринга
- Точки входа по умолчанию в шейдерные модули
- Поддержка display-p3 как цветового пространства GPUExternalTexture
- Информация о кучах памяти
- Обновления Dawn
Хром 120
- Поддержка 16-битных значений с плавающей запятой в WGSL
- Раздвинь границы
- Изменения в состоянии трафарета глубины
- Обновления информации об адаптере
- Квантование запросов по временным меткам
- Особенности генеральной уборки
Хром 119
- Фильтруемые 32-битные плавающие текстуры
- формат вершин unorm10-10-10-2
- формат текстуры rgb10a2uint
- Обновления Dawn
Хром 118
- Поддержка HTMLImageElement и ImageData в
copyExternalImageToTexture()
- Экспериментальная поддержка текстур хранения данных для чтения и записи и только для чтения
- Обновления Dawn
Хром 117
- Сбросить буфер вершин
- Отменить привязку группы
- Ошибки тишины при создании асинхронного конвейера при потере устройства
- Обновления создания шейдерного модуля SPIR-V
- Улучшение опыта разработчиков
- Кэширование конвейеров с автоматически сгенерированной компоновкой
- Обновления Dawn
Хром 116
- Интеграция WebCodecs
- Потерянное устройство, возвращенное GPUAdapter
requestDevice()
- Сохраняйте плавность воспроизведения видео, если вызывается
importExternalTexture()
- Соответствие спецификации
- Улучшение опыта разработчиков
- Обновления Dawn
Хром 115
- Поддерживаемые расширения языка WGSL
- Экспериментальная поддержка Direct3D 11
- Получите дискретный графический процессор по умолчанию при питании от сети переменного тока
- Улучшение опыта разработчиков
- Обновления Dawn
Хром 114
- Оптимизировать JavaScript
- getCurrentTexture() на ненастроенном холсте выдает InvalidStateError
- Обновления WGSL
- Обновления Dawn