מה חדש ב-WebGPU (Chrome {/7}128)

François Beaufort
François Beaufort

התנסות עם קבוצות משנה

התכונה 'קבוצות משנה' מאפשרת מקביליות ברמת SIMD, כך ששרשורים בתוך קבוצה יכולים לתקשר ולבצע פעולות מתמטיות משותפות (לדוגמה, חישוב הסכום של 16 מספרים). כך מתאפשר שיתוף נתונים יעיל במיוחד בין שרשורים.

הטמעה מינימלית של ההצעה בנושא קבוצות משנה זמינה לבדיקה מקומית מאחורי הדגל Unsafe WebGPU Support בכתובת chrome://flags/#enable-unsafe-webgpu.

אפשר גם לנסות קבוצות משנה באתר עם משתמשים אמיתיים על ידי הרשמה לניסיון המקור. הוראות להכנת האתר לשימוש בתקופות ניסיון של מקורות מופיעות במאמר תחילת השימוש בתקופות ניסיון של מקורות. תקופת הניסיון תפעל מגרסה Chrome 128 עד גרסה 131 (ותסתיים ב-19 בפברואר 2025). מידע נוסף על ניסויים

כשהתכונה "subgroups" זמינה ב-GPUAdapter, אפשר לבקש GPUDevice עם התכונה הזו כדי לקבל תמיכה בקבוצות משנה ב-WGSL ולבדוק את המגבלות של minSubgroupSize ושל maxSubgroupSize.

צריך גם להפעיל את התוסף הזה באופן מפורש בקוד WGSL באמצעות enable subgroups;. כשהאפשרות הזו מופעלת, מקבלים גישה לתוספות הבאות:

  • subgroup_invocation_id: ערך מובנה של אינדקס השרשור בתוך תת-הקבוצה.
  • subgroup_size: ערך מובנה לגישה לגודל תת-הקבוצה.
  • subgroupBallot(value): מחזירה קבוצה של שדות ביטים שבהם הביט שמתאים ל-subgroup_invocation_id הוא 1 אם value הוא true עבור הקריאה הפעילה הזו, ו-0 אחרת.
  • subgroupBroadcast(value, id): משדר את value מההפעלה עם subgroup_invocation_id שמתאים ל-id לכל ההפעלות בקבוצת המשנה. הערה: id חייב להיות קבוע בזמן ההידור.

בעתיד נוסיף עוד פונקציות מובנות, כמו subgroupAdd, ‏ subgroupAll, ‏ subgroupElect ו-subgroupShuffle. מידע נוסף זמין בבעיה מספר 354738715.

כדי לאפשר שימוש ב-f16 בפעולות של קבוצות משנה, צריך לבקש GPUDevice עם התכונות "subgroups",‏ "subgroups-f16" ו-"shader-f16", ואז להפעיל אותו בקוד WGSL באמצעות enable f16, subgroups, subgroups_f16;.

קטע הקוד הבא מספק בסיס להתנסות ולגילוי הפוטנציאל של קבוצות משנה.

const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("subgroups")) {
  throw new Error("Subgroups support is not available");
}
// Explicitly request subgroups support.
const device = await adapter.requestDevice({
  requiredFeatures: ["subgroups"],
});

const shaderModule = device.createShaderModule({ code: `
  enable subgroups;

  var<workgroup> wgmem : u32;

  @group(0) @binding(0)
  var<storage, read> inputs : array<u32>;

  @group(0) @binding(1)
  var<storage, read_write> output : array<u32>;

  @compute @workgroup_size(64)
  fn main(@builtin(subgroup_size) subgroupSize : u32,
          @builtin(subgroup_invocation_id) id : u32,
          @builtin(local_invocation_index) lid : u32) {
    // One thread per workgroup writes the value to workgroup memory.
    if (lid == 0) {
      wgmem = inputs[lid];
    }
    workgroupBarrier();
    var v = 0u;

    // One thread per subgroup reads the value from workgroup memory
    // and shares that value with every other thread in the subgroup
    // to reduce local memory bandwidth.
    if (id == 0) {
      v = wgmem;
    }
    v = subgroupBroadcast(v, 0);
    output[lid] = v;
  }`,
});

// Send the appropriate commands to the GPU...

הוצאה משימוש של הגדרת הטיה בעומק לקווים ולנקודות

שינוי במפרט WebGPU גורם לכך שהגדרת הערכים depthBias, depthBiasSlopeScale ו-depthBiasClamp לערך שאינו אפס, כשהטופולוגיה של צינור עיבוד התמונה היא מסוג קו או נקודה, תגרום לשגיאת אימות. כדי לתת למפתחים מספיק זמן לעדכן את הקוד שלהם, מוצגת אזהרה במסוף כלי הפיתוח לגבי האימות הקרוב, וגם הערכים מאולצים להיות 0 בנסיבות האלה. מידע נוסף זמין בבעיה מספר 352567424.

הסתרת אזהרה בכלי הפיתוח לגבי שגיאה שלא נתפסה אם preventDefault

במסוף כלי הפיתוח, אזהרות לגבי אירועי uncapturederror לא מוצגות יותר אם נרשם מאזין אירועים ל-uncapturederror והופעלה השיטה preventDefault() של האירוע בתוך הקריאה החוזרת של מאזין האירועים. ההתנהגות הזו תואמת לטיפול באירועים ב-JavaScript. אפשר לעיין בדוגמה הבאה ובבעיה מספר 40263619.

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

device.addEventListener("uncapturederror", (event) => {
  // Prevents browser warning to show up in the DevTools Console.
  event.preventDefault();

  // TODO: Handle event.error
});

קודם מתבצעת דגימה של אינטרפולציה ב-WGSL, ואז

מאפיין interpolate של WGSL מאפשר לכם לנהל אינטרפולציה של נתוני קלט/פלט שהוגדרו על ידי המשתמש. עכשיו, פרמטרים חדשים של דגימת אינטרפולציה first (ברירת מחדל) ו-either מאפשרים לכם שליטה נוספת: first משתמש בערך מהקודקוד הראשון של הפרימיטיב, ואילו either מאפשר שימוש בקודקוד הראשון או האחרון. בעיה מספר 340278447

עדכונים לגבי שעות השחר

ההטמעה של Dawn's WGPUFuture לטיפול בפעולות אסינכרוניות הושלמה. המושגים העיקריים כוללים את wgpuInstanceProcessEvents לעיבוד אירועים אופטימלי ואת WGPUCallbackMode להגדרת מיקומי קריאה חוזרת. ‫WGPUFuture מציין אירועים חד-פעמיים עם משך חיים אינסופי, ו-wgpuInstanceWaitAny ממתין להשלמה של אירוע עתידי או לזמן קצוב לתפוגה. מידע נוסף על בעיה מספר 42240932

הערך CompositeAlphaMode::Auto לא מדווח יותר על ידי Surface::GetCapabilities(). היא עדיין תקפה ושווה ל-Surface::GetCapabilities().alphaMode[0]. לפרטים על בעיה מספר 292

הקצה העורפי של OpenGL תומך עכשיו ב-Surface עם העתקה (blit) של היפוך בציר Y לכל קריאה של Present(). מידע נוסף על בעיה 344814083

השיטה Adapter::GetProperties() הוצאה משימוש. במקומה צריך להשתמש ב-Adapter::GetInfo().

ג'סוואנט, תורם חיצוני, כתב מחדש את כל קובצי ה-CMake, כך שקל יותר לעדכן אותם וניתן לבצע בנייה מראש. מומלץ לעיין במדריך למתחילים לשימוש ב-Dawn בפרויקטים של CMake.

המידע הזה כולל רק חלק מהנקודות העיקריות. רשימה מלאה של קומיטים

מה חדש ב-WebGPU

רשימה של כל הנושאים שמופיעים בסדרת המאמרים מה חדש ב-WebGPU.

Chrome 140

‫Chrome 139

‫Chrome 138

Chrome 137

Chrome 136

‫Chrome 135

‫Chrome 134

‫Chrome 133

‫Chrome 132

‫Chrome 131

‫Chrome 130

גרסה Chrome 129

‫Chrome 128

‫Chrome 127

‫Chrome 126

Chrome 125

‫Chrome 124

‫Chrome 123

‫Chrome 122

‫Chrome 121

‫Chrome 120

‫Chrome 119

‫Chrome 118

‫Chrome 117

Chrome 116

‫Chrome 115

‫Chrome 114

‫Chrome 113