מה חדש ב-WebGPU (Chrome {/7}128)

François Beaufort
François Beaufort

התנסות עם קבוצות משנה

התכונה 'קבוצות משנה' מאפשרת מקביליות ברמת SIMD, כך ששרשורים בתוך קבוצה יכולים לתקשר ולבצע פעולות מתמטיות משותפות (לדוגמה, חישוב הסכום של 16 מספרים). כך מתקבלת צורה יעילה מאוד של שיתוף נתונים בין שרשורים.

הטמעה מינימלית של ההצעה בנושא קבוצות משנה זמינה לבדיקה מקומית מאחורי הדגל Unsafe WebGPU Support בכתובת chrome://flags/#enable-unsafe-webgpu.

אפשר גם לנסות תת-קבוצות באתר עם משתמשים אמיתיים על ידי הרשמה לגרסת מקור לניסיון. במאמר איך מתחילים להשתמש בגרסאות מקור לניסיון מוסבר איך להכין את האתר לשימוש בגרסאות מקור לניסיון. גרסת המקור לניסיון תפעל מ-Chrome 128 עד Chrome 131 (היא תסתיים ב-19 בפברואר 2025). מידע נוסף על ניסויים

כשהתכונה "subgroups" זמינה ב-GPUAdapter, אפשר לבקש GPUDevice עם התכונה הזו כדי לקבל תמיכה בתת-קבוצות ב-WGSL ולבדוק את המגבלות של minSubgroupSize ושל maxSubgroupSize.

צריך גם להפעיל את התוסף הזה באופן מפורש בקוד WGSL באמצעות enable subgroups;. אחרי ההפעלה, תקבלו גישה לתוספות הבאות:

  • subgroup_invocation_id: ערך מובנה של האינדקס של השרשור בתוך תת-הקבוצה.
  • subgroup_size: ערך מובנה לגישה לגודל תת-הקבוצה.
  • subgroupBallot(value): מחזירה קבוצה של שדות ביטים שבהם הביט שתואם ל-subgroup_invocation_id הוא 1 אם value הוא true עבור הקריאה הפעילה הזו, ו-0 אחרת.
  • subgroupBroadcast(value, id): משדר את value מההפעלה עם subgroup_invocation_id שמתאים ל-id לכל ההפעלות בתוך תת-הקבוצה. הערה: id חייב להיות קבוע בזמן ההידור.

בעתיד נוסיף עוד פונקציות מובנות, כמו subgroupAdd, ‏ subgroupAll, ‏ subgroupElect ו-subgroupShuffle. מידע נוסף

כדי לאפשר שימוש ב-f16 בפעולות של קבוצות משנה, צריך לבקש GPUDevice עם התכונות "subgroups",‏ "subgroups-f16" ו-"shader-f16", ואז להפעיל אותו בקוד WGSL באמצעות enable f16, subgroups, subgroups_f16;.

קטע הקוד הבא מספק בסיס להתנסות ולגילוי הפוטנציאל של קבוצות משנה.

const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("subgroups")) {
  throw new Error("Subgroups support is not available");
}
// Explicitly request subgroups support.
const device = await adapter.requestDevice({
  requiredFeatures: ["subgroups"],
});

const shaderModule = device.createShaderModule({ code: `
  enable subgroups;

  var<workgroup> wgmem : u32;

  @group(0) @binding(0)
  var<storage, read> inputs : array<u32>;

  @group(0) @binding(1)
  var<storage, read_write> output : array<u32>;

  @compute @workgroup_size(64)
  fn main(@builtin(subgroup_size) subgroupSize : u32,
          @builtin(subgroup_invocation_id) id : u32,
          @builtin(local_invocation_index) lid : u32) {
    // One thread per workgroup writes the value to workgroup memory.
    if (lid == 0) {
      wgmem = inputs[lid];
    }
    workgroupBarrier();
    var v = 0u;

    // One thread per subgroup reads the value from workgroup memory
    // and shares that value with every other thread in the subgroup
    // to reduce local memory bandwidth.
    if (id == 0) {
      v = wgmem;
    }
    v = subgroupBroadcast(v, 0);
    output[lid] = v;
  }`,
});

// Send the appropriate commands to the GPU...

הוצאה משימוש של הגדרת הטיית עומק לקווים ולנקודות

שינוי במפרט WebGPU גורם לכך שהגדרת הערכים depthBias, depthBiasSlopeScale ו-depthBiasClamp לערך שאינו אפס, כשהטופולוגיה של צינור עיבוד התמונה היא מסוג קו או נקודה, תגרום לשגיאת אימות. כדי לתת למפתחים מספיק זמן לעדכן את הקוד שלהם, מוצגת אזהרה במסוף כלי הפיתוח לגבי האימות הקרוב, וגם הערכים מאולצים להיות 0 בנסיבות האלה. מידע נוסף

הסתרת אזהרה בכלי הפיתוח לגבי שגיאה שלא נתפסה אם preventDefault

במסוף כלי פיתוח, אזהרות לגבי אירועים של uncapturederror לא מוצגות יותר אם נרשם רכיב event listener ל-uncapturederror והופעלה השיטה preventDefault() של האירוע בתוך הקריאה החוזרת (callback) של רכיב event listener. ההתנהגות הזו תואמת לטיפול באירועים ב-JavaScript. אפשר לעיין בדוגמה הבאה ובבעיה מספר 40263619.

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

device.addEventListener("uncapturederror", (event) => {
  // Prevents browser warning to show up in the DevTools Console.
  event.preventDefault();

  // TODO: Handle event.error
});

דגימת האינטרפולציה של WGSL מתבצעת קודם, ואז

מאפיין interpolate של WGSL מאפשר לכם לנהל אינטרפולציה של נתוני קלט/פלט שהוגדרו על ידי המשתמש. עכשיו, פרמטרים חדשים של דגימת אינטרפולציה first (ברירת מחדל) ו-either מעניקים לכם שליטה נוספת: first משתמש בערך מהקודקוד הראשון של הפרימיטיב, ואילו either מאפשר שימוש בקודקוד הראשון או האחרון. מידע נוסף

עדכונים של Dawn

ההטמעה של WGPUFuture ב-Dawn לטיפול בפעולות אסינכרוניות הושלמה. המושגים המרכזיים כוללים wgpuInstanceProcessEvents לעיבוד אירועים אופטימלי ו-WGPUCallbackMode להגדרת מיקומי קריאה חוזרת (callback). ‫WGPUFuture מציין אירועים חד-פעמיים עם משך חיים אינסופי, ו-wgpuInstanceWaitAny ממתין להשלמה של אירוע עתידי או לזמן קצוב לתפוגה. מידע נוסף

הערך CompositeAlphaMode::Auto לא מדווח יותר על ידי Surface::GetCapabilities(). היא עדיין תקפה ושווה ל-Surface::GetCapabilities().alphaMode[0]. מידע נוסף

הקצה העורפי של OpenGL תומך עכשיו ב-Surface עם העברה של y-flip לכל קריאה של Present(). ראו בעיה מספר 344814083.

השיטה Adapter::GetProperties() הוצאה משימוש. במקומה צריך להשתמש ב-Adapter::GetInfo().

ג'סוואנט, תורם חיצוני, כתב מחדש את כל קובצי ה-CMake, כדי שיהיה קל יותר לעדכן אותם ולאפשר בנייה מראש. אפשר לעיין במדריך למתחילים לשימוש ב-Dawn בפרויקטים של CMake.

המידע הזה כולל רק נקודות עיקריות. רשימה מלאה של קומיטים

מה חדש ב-WebGPU

רשימה של כל הנושאים שמופיעים בסדרת המאמרים מה חדש ב-WebGPU.

‫Chrome 149-150

‫Chrome 147-148

Chrome 146

Chrome 145

Chrome 144

Chrome 143

Chrome 142

Chrome 141

Chrome 140

Chrome 139

Chrome 138

Chrome 137

Chrome 136

Chrome 135

Chrome 134

Chrome 133

Chrome 132

Chrome 131

Chrome 130

Chrome 129

‫Chrome 128

Chrome 127

Chrome 126

‫Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113