מה חדש ב-WebGPU (Chrome {/7}128)

François Beaufort
François Beaufort

התנסות עם קבוצות משנה

תכונת קבוצות המשנה מאפשרת מקביליות ברמת SIMD, ומאפשרת לשרשורים בתוך קבוצה לתקשר ולבצע פעולות מתמטיות משותפות (לדוגמה, חישוב הסכום של 16 מספרים). כך מתאפשר שיתוף נתונים יעיל במיוחד בין שרשורים.

אפשר לבצע בדיקות מקומיות של יישום מינימלי של ההצעה בנושא קבוצות משנה באמצעות האפשרות Unsafe WebGPU Support ב-chrome://flags/#enable-unsafe-webgpu.

אפשר גם לנסות קבוצות משנה באתר עם משתמשים אמיתיים על ידי הרשמה לתקופת ניסיון של התכונה. במאמר איך מתחילים להשתמש בגרסאות מקור לניסיון מוסבר איך להכין את האתר לשימוש בגרסאות מקור לניסיון. גרסת המקור לניסיון תפעל מ-Chrome 128 עד Chrome 131 (היא תסתיים ב-19 בפברואר 2025). מידע נוסף על ניסויים

כשהתכונה "subgroups" זמינה ב-GPUAdapter, אפשר לבקש GPUDevice עם התכונה הזו כדי לקבל תמיכה בקבוצות משנה ב-WGSL ולבדוק את המגבלות של minSubgroupSize ושל maxSubgroupSize.

צריך גם להפעיל את התוסף הזה באופן מפורש בקוד WGSL באמצעות enable subgroups;. אחרי ההפעלה, תקבלו גישה לתוספות הבאות:

  • subgroup_invocation_id: ערך מובנה של אינדקס השרשור בתוך תת-הקבוצה.
  • subgroup_size: ערך מובנה לגישה לגודל תת-הקבוצה.
  • subgroupBallot(value): מחזירה קבוצה של שדות ביטים שבהם הביט שמתאים ל-subgroup_invocation_id הוא 1 אם value הוא true עבור הקריאה הפעילה הזו, ו-0 אחרת.
  • subgroupBroadcast(value, id): משדר את value מהקריאה עם subgroup_invocation_id שמתאים ל-id לכל הקריאות בקבוצת המשנה. הערה: id חייב להיות קבוע בזמן ההידור.

בעתיד נוסיף עוד פונקציות מובנות, כמו subgroupAdd, ‏ subgroupAll, ‏ subgroupElect ו-subgroupShuffle. מידע נוסף

כדי לאפשר f16 בפעולות של קבוצות משנה, צריך לבקש GPUDevice עם התכונות "subgroups", "subgroups-f16" ו-"shader-f16", ואז להפעיל אותו בקוד WGSL באמצעות enable f16, subgroups, subgroups_f16;.

קטע הקוד הבא מספק בסיס להתנסות ולגילוי הפוטנציאל של קבוצות משנה.

const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("subgroups")) {
  throw new Error("Subgroups support is not available");
}
// Explicitly request subgroups support.
const device = await adapter.requestDevice({
  requiredFeatures: ["subgroups"],
});

const shaderModule = device.createShaderModule({ code: `
  enable subgroups;

  var<workgroup> wgmem : u32;

  @group(0) @binding(0)
  var<storage, read> inputs : array<u32>;

  @group(0) @binding(1)
  var<storage, read_write> output : array<u32>;

  @compute @workgroup_size(64)
  fn main(@builtin(subgroup_size) subgroupSize : u32,
          @builtin(subgroup_invocation_id) id : u32,
          @builtin(local_invocation_index) lid : u32) {
    // One thread per workgroup writes the value to workgroup memory.
    if (lid == 0) {
      wgmem = inputs[lid];
    }
    workgroupBarrier();
    var v = 0u;

    // One thread per subgroup reads the value from workgroup memory
    // and shares that value with every other thread in the subgroup
    // to reduce local memory bandwidth.
    if (id == 0) {
      v = wgmem;
    }
    v = subgroupBroadcast(v, 0);
    output[lid] = v;
  }`,
});

// Send the appropriate commands to the GPU...

הוצאה משימוש של הגדרת הטיה בעומק לקווים ולנקודות

שינוי במפרט WebGPU גורם לכך שהגדרת הערכים depthBias, depthBiasSlopeScale ו-depthBiasClamp לערך שאינו אפס, כשהטופולוגיה של צינור עיבוד היא מסוג קו או נקודה, תגרום לשגיאת אימות. כדי לתת למפתחים מספיק זמן לעדכן את הקוד שלהם, מוצגת אזהרה במסוף כלי הפיתוח לגבי האימות הקרוב, וגם הערכים מאולצים להיות 0 בנסיבות האלה. מידע נוסף

הסתרת אזהרה בכלי הפיתוח לגבי שגיאה שלא נתפסה אם preventDefault

במסוף כלי הפיתוח, אזהרות לגבי אירועי uncapturederror לא מוצגות יותר אם נרשם מאזין אירועים ל-uncapturederror והופעלה השיטה preventDefault() של האירוע בתוך הקריאה החוזרת של מאזין האירועים. ההתנהגות הזו תואמת לטיפול באירועים ב-JavaScript. אפשר לעיין בדוגמה הבאה ובבעיה מספר 40263619.

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

device.addEventListener("uncapturederror", (event) => {
  // Prevents browser warning to show up in the DevTools Console.
  event.preventDefault();

  // TODO: Handle event.error
});

דגימת האינטרפולציה של WGSL מתבצעת קודם, ואז

המאפיין interpolate ב-WGSL מאפשר לכם לנהל אינטרפולציה של נתוני קלט/פלט שהוגדרו על ידי המשתמש. עכשיו, פרמטרים חדשים של דגימת אינטרפולציה first (ברירת מחדל) ו-either מעניקים לכם שליטה נוספת: first משתמש בערך מהקודקוד הראשון של הפרימיטיב, ואילו either מאפשר שימוש בקודקוד הראשון או האחרון. מידע נוסף

עדכונים של Dawn

ההטמעה של Dawn's WGPUFuture לטיפול בפעולות אסינכרוניות הושלמה. המושגים המרכזיים כוללים את wgpuInstanceProcessEvents לעיבוד אירועים אופטימלי ואת WGPUCallbackMode להגדרת מיקומי קריאה חוזרת (callback). ‫WGPUFuture מציין אירועים חד-פעמיים עם משך חיים אינסופי, והפונקציה wgpuInstanceWaitAny ממתינה להשלמה של אירוע עתידי או לזמן קצוב לתפוגה. מידע נוסף

הערך CompositeAlphaMode::Auto לא מדווח יותר על ידי Surface::GetCapabilities(). היא עדיין תקפה ושווה ל-Surface::GetCapabilities().alphaMode[0]. מידע נוסף

הקצה העורפי של OpenGL תומך עכשיו ב-Surface עם blit של היפוך בציר Y לכל קריאה של Present(). מידע נוסף

השיטה Adapter::GetProperties() הוצאה משימוש. במקומה יש להשתמש בשיטה Adapter::GetInfo().

ג'סוואנט, תורם חיצוני, כתב מחדש את כל קובצי ה-CMake, כדי שיהיה קל יותר לעדכן אותם וכדי לאפשר בנייה מראש. אפשר לעיין במדריך למתחילים לשימוש ב-Dawn בפרויקטים של CMake.

המידע הזה כולל רק נקודות עיקריות. רשימה מלאה של קומיטים

מה חדש ב-WebGPU

רשימה של כל הנושאים שמופיעים בסדרת המאמרים מה חדש ב-WebGPU.

Chrome 143

Chrome 142

Chrome 141

Chrome 140

Chrome 139

Chrome 138

Chrome 137

Chrome 136

Chrome 135

Chrome 134

Chrome 133

Chrome 132

Chrome 131

Chrome 130

Chrome 129

Chrome 128

Chrome 127

Chrome 126

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113