Эксперименты с подгруппами
Функция подгрупп обеспечивает параллелизм на уровне SIMD, позволяя потокам внутри группы общаться и выполнять коллективные математические операции (например, вычисление суммы 16 чисел). Это обеспечивает высокоэффективную форму обмена данными между потоками.
Минимальная реализация предложения подгрупп доступна для локального тестирования с флагом «Unsafe WebGPU Support» по адресу chrome://flags/#enable-unsafe-webgpu
.
Вы также можете попробовать подгруппы на своем сайте с реальными пользователями, зарегистрировавшись на пробную версию origin . Прочтите раздел Начало работы с пробными версиями origin, чтобы узнать, как подготовить свой сайт к использованию пробных версий origin. Пробная версия origin будет работать с Chrome 128 по 131 (до 19 февраля 2025 г.). См. раздел Намерение экспериментировать .
Если функция "subgroups"
доступна в GPUAdapter
, запросите GPUDevice
с этой функцией, чтобы получить поддержку подгрупп в WGSL и проверить его ограничения minSubgroupSize
и maxSubgroupSize
.
Вам также необходимо явно включить это расширение в вашем коде WGSL с помощью enable subgroups;
При включении вы получаете доступ к следующим дополнениям:
-
subgroup_invocation_id
: встроенное значение индекса потока внутри подгруппы. -
subgroup_size
: встроенное значение для доступа к размеру подгруппы. -
subgroupBallot(value)
: возвращает набор битовых полей, где бит, соответствующийsubgroup_invocation_id
, равен 1, еслиvalue
равно true для этого активного вызова, и 0 в противном случае. -
subgroupBroadcast(value, id)
: Транслируетvalue
из вызова сsubgroup_invocation_id
, соответствующимid
, всем вызовам в подгруппе. Примечание:id
должен быть константой времени компиляции.
В будущем будут добавлены дополнительные встроенные функции, такие как subgroupAdd
, subgroupAll
, subgroupElect
, subgroupShuffle
. См. issue 354738715 .
Чтобы разрешить f16 в операциях подгрупп, запросите GPUDevice
с функциями "subgroups"
, "subgroups-f16"
и "shader-f16"
, затем включите его в коде WGSL с помощью enable f16, subgroups, subgroups_f16;
Следующий фрагмент кода предоставляет основу для экспериментов и раскрытия потенциала подгрупп.
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("subgroups")) {
throw new Error("Subgroups support is not available");
}
// Explicitly request subgroups support.
const device = await adapter.requestDevice({
requiredFeatures: ["subgroups"],
});
const shaderModule = device.createShaderModule({ code: `
enable subgroups;
var<workgroup> wgmem : u32;
@group(0) @binding(0)
var<storage, read> inputs : array<u32>;
@group(0) @binding(1)
var<storage, read_write> output : array<u32>;
@compute @workgroup_size(64)
fn main(@builtin(subgroup_size) subgroupSize : u32,
@builtin(subgroup_invocation_id) id : u32,
@builtin(local_invocation_index) lid : u32) {
// One thread per workgroup writes the value to workgroup memory.
if (lid == 0) {
wgmem = inputs[lid];
}
workgroupBarrier();
var v = 0u;
// One thread per subgroup reads the value from workgroup memory
// and shares that value with every other thread in the subgroup
// to reduce local memory bandwidth.
if (id == 0) {
v = wgmem;
}
v = subgroupBroadcast(v, 0);
output[lid] = v;
}`,
});
// Send the appropriate commands to the GPU...
Отменить настройку смещения глубины для линий и точек
Изменение спецификации WebGPU приводит к ошибке проверки при установке ненулевого значения depthBias
, depthBiasSlopeScale
и depthBiasClamp
, когда топология конвейера рендеринга — это тип линии или точки. Чтобы дать разработчикам достаточно времени для обновления кода, в консоли DevTools отображается предупреждение об этой предстоящей проверке, а также принудительно устанавливаются значения 0 в этих обстоятельствах. См. issue 352567424 .
Скрыть предупреждение DevTools об неперехваченной ошибке, если preventDefault
В консоли DevTools предупреждения для событий uncapturederror
больше не отображаются, если прослушиватель событий для uncapturederror
был зарегистрирован и метод Event preventDefault()
был вызван в обратном вызове прослушивателя событий. Это поведение соответствует обработке событий в JavaScript. См. следующий пример и проблему 40263619 .
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
device.addEventListener("uncapturederror", (event) => {
// Prevents browser warning to show up in the DevTools Console.
event.preventDefault();
// TODO: Handle event.error
});
WGSL сначала интерполирует выборку и либо
Атрибут interpolate
WGSL позволяет управлять пользовательской интерполяцией данных ввода-вывода. Теперь новые параметры выборки интерполяции first
(по умолчанию) и either
дают вам дополнительный контроль: first
использует значение из первой вершины примитива, в то время как either
допускает либо первую, либо последнюю вершину. См. issue 340278447 .
Обновления рассвета
Реализация WGPUFuture от Dawn для обработки асинхронных операций теперь завершена. Ключевые концепции включают wgpuInstanceProcessEvents для оппортунистической обработки событий и WGPUCallbackMode для определения мест обратного вызова. WGPUFuture обозначает одноразовые события с бесконечным временем жизни, а wgpuInstanceWaitAny ожидает завершения любого будущего или тайм-аута. См. issue 42240932 .
Значение CompositeAlphaMode::Auto
теперь не сообщается Surface::GetCapabilities()
. Оно по-прежнему действительно и эквивалентно Surface::GetCapabilities().alphaMode[0]
. См. проблему 292 .
Бэкэнд OpenGL теперь поддерживает Surface
с y-flip blit для каждого вызова Present()
. См. issue 344814083 .
Метод Adapter::GetProperties()
устарел в пользу использования Adapter::GetInfo()
.
Jaswant, внешний участник, переписал все файлы CMake, упростив их обновление и сделав возможными предварительные сборки. Ознакомьтесь с кратким руководством по использованию Dawn в проектах CMake.
Это охватывает только некоторые из ключевых моментов. Ознакомьтесь с исчерпывающим списком коммитов .
Что нового в WebGPU
Список всего, что было рассмотрено в серии « Что нового в WebGPU» .
Хром 138
- Сокращение для использования буфера в качестве связующего ресурса
- Требования к размеру меняются для буферов, отображаемых при создании
- Отчет об архитектуре последних графических процессоров
- Отменить использование атрибута GPUAdapter isFallbackAdapter
- Обновления рассвета
Хром 137
- Использовать вид текстуры для привязки externalTexture
- Буферы копируются без указания смещения и размера
- WGSL workgroupUniformLoad с использованием указателя на атомарный
- Атрибут powerPreference GPUAdapterInfo
- Удалить атрибут совместимости GPURequestAdapterOptions
- Обновления рассвета
Хром 136
- GPUAdapterInfo — атрибут FallbackAdapter
- Улучшение времени компиляции шейдера на D3D12
- Сохраняйте и копируйте изображения холста
- Снять ограничения режима совместимости
- Обновления рассвета
Хром 135
- Разрешить создание макета конвейера с макетом группы нулевой привязки
- Разрешить областям просмотра выходить за пределы границ целевых объектов рендеринга
- Более простой доступ к экспериментальному режиму совместимости на Android
- Удалить ограничение maxInterStageShaderComponents
- Обновления рассвета
Хром 134
- Улучшите рабочие нагрузки машинного обучения с помощью подгрупп
- Удалить поддержку плавающих фильтруемых типов текстур как смешиваемых
- Обновления рассвета
Хром 133
- Дополнительные форматы вершин unorm8x4-bgra и 1-компонентные
- Разрешить запрашивать неизвестные лимиты с неопределенным значением
- Изменения правил выравнивания WGSL
- Повышение производительности WGSL с отбрасыванием
- Используйте VideoFrame displaySize для внешних текстур
- Обработка изображений с ориентацией, отличной от стандартной, с помощью copyExternalImageToTexture
- Улучшение опыта разработчиков
- Включить режим совместимости с featureLevel
- Экспериментальная подгруппа функций очистки
- Отменить ограничение maxInterStageShaderComponents
- Обновления рассвета
Хром 132
- Использование вида текстуры
- Смешивание 32-битных плавающих текстур
- Атрибут GPUDevice adapterInfo
- Настройка контекста холста с недопустимым форматом приводит к ошибке JavaScript
- Фильтрация ограничений сэмплера на текстуры
- Расширенные эксперименты с подгруппами
- Улучшение опыта разработчиков
- Экспериментальная поддержка 16-битных нормализованных форматов текстур
- Обновления рассвета
Хром 131
- Расстояния клипов в WGSL
- GPUCanvasContext получитьКонфигурацию()
- Точечные и линейные примитивы не должны иметь смещения глубины.
- Встроенные функции сканирования для подгрупп
- Экспериментальная поддержка многоразового непрямого вывода
- Опция компиляции шейдерного модуля строгая математика
- Удалить GPUAdapter requestAdapterInfo()
- Обновления рассвета
Хром 130
- Смешивание двух источников
- Улучшение времени компиляции шейдеров на Metal
- Устаревание GPUAdapter requestAdapterInfo()
- Обновления рассвета
Хром 129
- Поддержка HDR с режимом тональной компрессии Canvas
- Расширенная поддержка подгрупп
- Обновления рассвета
Хром 128
- Эксперименты с подгруппами
- Отменить настройку смещения глубины для линий и точек
- Скрыть предупреждение DevTools об неперехваченной ошибке, если preventDefault
- WGSL сначала интерполирует выборку и либо
- Обновления рассвета
Хром 127
- Экспериментальная поддержка OpenGL ES на Android
- Атрибут информации GPUAdapter
- Улучшения взаимодействия WebAssembly
- Улучшены ошибки кодировщика команд
- Обновления рассвета
Хром 126
- Увеличить лимит maxTextureArrayLayers
- Оптимизация загрузки буфера для бэкэнда Vulkan
- Улучшения времени компиляции шейдера
- Отправленные буферы команд должны быть уникальными.
- Обновления рассвета
Хром 125
Хром 124
- Текстуры хранения данных, доступные только для чтения и для чтения и записи
- Поддержка работников сферы услуг и коллективных работников
- Новые атрибуты информации об адаптере
- Исправления ошибок
- Обновления рассвета
Хром 123
- Поддержка встроенных функций DP4a в WGSL
- Неограниченные параметры указателя в WGSL
- Синтаксический сахар для разыменования композитов в WGSL
- Отдельное состояние «только для чтения» для аспектов трафарета и глубины
- Обновления рассвета
Хром 122
- Расширьте охват с помощью режима совместимости (функция в разработке)
- Увеличить лимит maxVertexAttributes
- Обновления рассвета
Хром 121
- Поддержка WebGPU на Android
- Используйте DXC вместо FXC для компиляции шейдеров в Windows
- Запросы временных меток в проходах вычислений и рендеринга
- Точки входа по умолчанию в шейдерные модули
- Поддержка display-p3 как цветового пространства GPUExternalTexture
- Информация о кучах памяти
- Обновления рассвета
Хром 120
- Поддержка 16-битных значений с плавающей точкой в WGSL
- Раздвиньте границы
- Изменения в состоянии трафарета глубины
- Обновления информации об адаптере
- Квантование запросов временных меток
- Особенности генеральной уборки
Хром 119
- Фильтруемые 32-битные плавающие текстуры
- формат вершин unorm10-10-10-2
- формат текстуры rgb10a2uint
- Обновления рассвета
Хром 118
- Поддержка HTMLImageElement и ImageData в
copyExternalImageToTexture()
- Экспериментальная поддержка текстур хранения данных для чтения и записи и только для чтения
- Обновления рассвета
Хром 117
- Сбросить буфер вершин
- Отменить привязку группы
- Ошибки тишины при создании асинхронного конвейера при потере устройства
- Обновления создания шейдерного модуля SPIR-V
- Улучшение опыта разработчиков
- Кэширование конвейеров с автоматически сгенерированной компоновкой
- Обновления рассвета
Хром 116
- Интеграция WebCodecs
- Потерянное устройство, возвращенное GPUAdapter
requestDevice()
- Сохраняйте плавность воспроизведения видео, если вызывается
importExternalTexture()
- Соответствие спецификации
- Улучшение опыта разработчиков
- Обновления рассвета
Хром 115
- Поддерживаемые расширения языка WGSL
- Экспериментальная поддержка Direct3D 11
- Получите дискретный графический процессор по умолчанию при питании от сети переменного тока
- Улучшение опыта разработчиков
- Обновления рассвета
Хром 114
- Оптимизировать JavaScript
- getCurrentTexture() на ненастроенном холсте выдает InvalidStateError
- Обновления WGSL
- Обновления рассвета