תמיכה בפונקציות מובנות של DP4a ב-WGSL
DP4a (Dot Product of 4 Elements and Accumulate) מתייחס לקבוצה של הוראות GPU שנמצאות בשימוש נפוץ בהסקת מסקנות של למידה עמוקה לצורך קוונטיזציה. הוא מבצע ביעילות מכפלות סקלריות של מספרים שלמים בני 8 ביט כדי להאיץ את החישוב של מודלים כאלה שעברו קוונטיזציה של int8. הוא יכול לחסוך (עד 75%) בזיכרון וברוחב הפס של הרשת, ולשפר את הביצועים של כל מודל למידת מכונה בהסקת מסקנות בהשוואה לגרסת f32 שלו. כתוצאה מכך, נעשה בו שימוש נרחב בהרבה מסגרות פופולריות של AI.
אם "packed_4x8_integer_dot_product"
WGSL language extension מופיע ב-navigator.gpu.wgslLanguageFeatures
, עכשיו אפשר להשתמש בסקלרים של מספרים שלמים בני 32 ביט לאריזת וקטורים של 4 רכיבים של מספרים שלמים בני 8 ביט כקלט להוראות של מכפלה סקלרית בקוד של הצללה ב-WGSL עם הפונקציות המובנות dot4U8Packed
ו-dot4I8Packed
. אפשר גם להשתמש בהוראות אריזה ופריקה עם וקטורים ארוזים של 4 רכיבים של מספרים שלמים בני 8 ביט עם הפונקציות המובנות pack4xI8
, pack4xU8
, pack4xI8Clamp
, pack4xU8Clamp
, unpack4xI8
ו-unpack4xU8
של WGSL.
מומלץ להשתמש בrequires-directive כדי לציין את הפוטנציאל לאי-ניידות באמצעות requires packed_4x8_integer_dot_product;
בחלק העליון של קוד ה-shader של WGSL. אפשר לעיין בדוגמה הבאה ובבעיה של גוון:1497.
if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
throw new Error(`DP4a built-in functions are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires packed_4x8_integer_dot_product;
fn main() {
const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
}`,
});
תודה מיוחדת לצוות הגרפיקה באינטרנט של Intel בשנגחאי על קידום המפרט וההטמעה עד להשלמה!
פרמטרים של מצביעים ללא הגבלה ב-WGSL
"unrestricted_pointer_parameters"
תוסף השפה WGSL מרחיב את ההגבלות על האפשרות להעביר מצביעים לפונקציות WGSL:
מצביעים לפרמטרים של מרחבי הכתובות
storage
,uniform
ו-workgroup
לפונקציות שהמשתמש הצהיר עליהן.העברת מצביעים לחברים במבנה ולאלמנטים במערך לפונקציות שהמשתמש הצהיר עליהן.
אפשר לזהות את התכונה הזו באמצעות navigator.gpu.wgslLanguageFeatures
. מומלץ להשתמש תמיד בהוראת requires כדי לציין את האפשרות לאי-ניידות באמצעות requires unrestricted_pointer_parameters;
בחלק העליון של קוד ה-shader של WGSL. אפשר לעיין בדוגמה הבאה, בשינויים במפרט של WGSL ובבעיה tint:2053.
if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
throw new Error(`Unrestricted pointer parameters are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires unrestricted_pointer_parameters;
@group(0) @binding(0) var<storage, read_write> S : i32;
fn func(pointer : ptr<storage, i32, read_write>) {
*pointer = 42;
}
@compute @workgroup_size(1)
fn main() {
func(&S);
}`
});
תחביר נוח לביטול הפניה של קומפוזיציות ב-WGSL
אם "pointer_composite_access"
התוסף לשפת WGSL מופיע ב-navigator.gpu.wgslLanguageFeatures
, קוד ה-shader של WGSL תומך עכשיו בגישה לרכיבים של סוגי נתונים מורכבים באמצעות אותה תחביר של נקודה (.
), בין אם אתם עובדים ישירות עם הנתונים או עם מצביע לנתונים. ככה זה עובד:
אם
foo
הוא מצביע:foo.bar
היא דרך נוחה יותר לכתוב(*foo).bar
. בדרך כלל צריך להוסיף כוכבית (*
) כדי להפוך את המצביע ל'הפניה' שאפשר לבטל את ההפניה שלה, אבל עכשיו המצביעים וההפניות דומים הרבה יותר ואפשר להשתמש בהם לסירוגין.אם
foo
הוא לא מצביע: האופרטור של הנקודה (.
) פועל בדיוק כמו שאתם רגילים לגישה ישירה לחברים.
באופן דומה, אם pa
הוא מצביע שמאחסן את כתובת ההתחלה של מערך, השימוש ב-pa[i]
נותן לכם גישה ישירה למיקום בזיכרון שבו מאוחסן הרכיב ה-'i
של המערך הזה.
מומלץ להשתמש בrequires-directive כדי לציין את הפוטנציאל לאי-ניידות באמצעות requires pointer_composite_access;
בחלק העליון של קוד ה-shader של WGSL. אפשר לעיין בדוגמה הבאה ובבעיה tint:2113.
if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
throw new Error(`Pointer composite access is not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires pointer_composite_access;
fn main() {
var a = vec3f();
let p : ptr<function, vec3f> = &a;
let r1 = (*p).x; // always valid.
let r2 = p.x; // requires pointer composite access.
}`
});
מצב קריאה בלבד נפרד להיבטים של שבלונה ועומק
בעבר, קבצים מצורפים של עומק-סטנסיל לקריאה בלבד במעברי רינדור דרשו ששני ההיבטים (עומק וסטנסיל) יהיו לקריאה בלבד. המגבלה הזו הוסרה. עכשיו אפשר להשתמש בהיבט העומק במצב קריאה בלבד, למשל למעקב אחרי צללים של אנשי קשר, בזמן שמאגר הסטנסיל נכתב כדי לזהות פיקסלים לעיבוד נוסף. לפרטים על הבעיה: dawn:2146
עדכונים לגבי שעות השחר
הקריאה החוזרת (callback) של שגיאה שלא נתפסה שהוגדרה באמצעות wgpuDeviceSetUncapturedErrorCallback()
נקראת עכשיו באופן מיידי כשהשגיאה מתרחשת. זה מה שמפתחים מצפים לו באופן עקבי ורוצים לניפוי באגים. שינוי שחר:173620
השיטה wgpuSurfaceGetPreferredFormat()
מתוך webgpu.h API הוטמעה. ראו issue dawn:1362.
המידע הזה כולל רק חלק מהנקודות העיקריות. רשימה מלאה של קומיטים
מה חדש ב-WebGPU
רשימה של כל הנושאים שמופיעים בסדרת המאמרים מה חדש ב-WebGPU.
Chrome 140
- בקשות מהמכשיר צורכות מתאם
- קיצור דרך לשימוש בטקסטורה במקום שבו נעשה שימוש בתצוגת טקסטורה
- הפונקציה textureSampleLevel ב-WGSL תומכת בטקסטורות חד-ממדיות
- הוצאה משימוש של שימוש בטקסטורת אחסון לקריאה בלבד מסוג bgra8unorm
- הסרת המאפיין isFallbackAdapter של GPUAdapter
- עדכונים מ-Dawn
Chrome 139
- תמיכה בטקסטורות תלת-ממדיות בפורמטים דחוסים של BC ו-ASTC
- תכונה חדשה: core-features-and-limits
- תקופת ניסיון של תכונה חדשה למצב תאימות של WebGPU
- עדכונים מ-Dawn
Chrome 138
- קיצור דרך לשימוש ב-buffer כמשאב מחייב
- שינויים בדרישות הגודל של מאגרי נתונים זמניים שמופים בזמן היצירה
- דוח ארכיטקטורה של יחידות GPU מהזמן האחרון
- הוצאה משימוש של המאפיין isFallbackAdapter של GPUAdapter
- עדכונים מ-Dawn
Chrome 137
- שימוש בתצוגת טקסטורה לקישור externalTexture
- העתקת מאגרי נתונים בלי לציין היסטים וגודל
- WGSL workgroupUniformLoad using pointer to atomic
- המאפיין powerPreference של GPUAdapterInfo
- הסרת המאפיין compatibilityMode של GPURequestAdapterOptions
- עדכונים מ-Dawn
Chrome 136
- המאפיין isFallbackAdapter של GPUAdapterInfo
- שיפורים בזמן ההידור של Shader ב-D3D12
- שמירה והעתקה של תמונות בקנבס
- הגבלות במצב תאימות של מדידת השיפור
- עדכונים מ-Dawn
Chrome 135
- Allow creating pipeline layout with null bind group layout
- התרת חריגה של אזורי תצוגה מגבולות יעדי הרינדור
- גישה קלה יותר למצב התאימות הניסיוני ב-Android
- הסרת המגבלה maxInterStageShaderComponents
- עדכונים מ-Dawn
Chrome 134
- שיפור עומסי עבודה של למידת מכונה באמצעות קבוצות משנה
- הסרת התמיכה בסוגי מרקם שניתנים לסינון כמרקמים שניתנים למיזוג
- עדכונים מ-Dawn
Chrome 133
- פורמטים נוספים של קודקסי צבעים unorm8x4-bgra ושל קודקסי צבעים של רכיב אחד של קודקסי צבעים של קודקסי צבעים
- מתן אפשרות לבקש הגדלה של מגבלות לא ידועות עם ערך לא מוגדר
- שינויים בכללים של WGSL
- שיפורים בביצועים של WGSL עם discard
- שימוש ב-VideoFrame displaySize לטקסטורות חיצוניות
- טיפול בתמונות עם כיוונים שאינם ברירת המחדל באמצעות copyExternalImageToTexture
- שיפור חוויית המפתחים
- הפעלת מצב תאימות באמצעות featureLevel
- ניקוי של תכונות ניסיוניות של קבוצות משנה
- הוצאה משימוש של המגבלה maxInterStageShaderComponents
- עדכונים מ-Dawn
Chrome 132
- שימוש בתצוגת הטקסטורה
- מיזוג של מרקמים מסוג float ב-32 ביט
- המאפיין adapterInfo של GPUDevice
- הגדרת הקשר של אזור הציור בפורמט לא תקין גורמת לשגיאת JavaScript
- הגבלות על מסנני דגימה של טקסטורות
- ניסויים מורחבים בתתי-קבוצות
- שיפור חוויית המפתחים
- תמיכה ניסיונית בפורמטים של טקסטורות נורמליות של 16 ביט
- עדכונים מ-Dawn
Chrome 131
- חיתוך מרחקים ב-WGSL
- GPUCanvasContext getConfiguration()
- לפרימיטיבים של נקודות וקווים אסור להיות הטיה בעומק
- פונקציות מובנות לסריקה כוללת של קבוצות משנה
- תמיכה ניסיונית בציור עקיף של כמה רכיבים
- Shader module compilation option strict math
- הסרת השיטה requestAdapterInfo() של GPUAdapter
- עדכונים מ-Dawn
Chrome 130
- מיזוג של שני מקורות
- שיפורים בזמן ההידור של Shader ב-Metal
- הוצאה משימוש של requestAdapterInfo() ב-GPUAdapter
- עדכונים מ-Dawn
גרסה Chrome 129
Chrome 128
- התנסות עם תתי-קבוצות
- הוצאה משימוש של הגדרת הטיית עומק לקווים ולנקודות
- הסתרת אזהרה בכלי הפיתוח לגבי שגיאה שלא נתפסה אם preventDefault
- קודם מתבצעת דגימת אינטרפולציה של WGSL ואז אחת מהפעולות הבאות:
- עדכונים מ-Dawn
Chrome 127
- תמיכה ניסיונית ב-OpenGL ES ב-Android
- מאפיין המידע של GPUAdapter
- שיפורים ב-WebAssembly interop
- שיפורים בשגיאות של מקודד הפקודות
- עדכונים מ-Dawn
Chrome 126
- הגדלת המגבלה maxTextureArrayLayers
- אופטימיזציה של העלאת מאגרים עבור קצה עורפי של Vulkan
- שיפורים בזמן ההידור של Shader
- מאגרי פקודות שנשלחים צריכים להיות ייחודיים
- עדכונים מ-Dawn
Chrome 125
Chrome 124
- טקסטורות של אחסון לקריאה בלבד ולקריאה וכתיבה
- תמיכה ב-Service Workers וב-Shared Workers
- מאפיינים חדשים של מידע על מתאמים
- תיקוני באגים
- עדכונים מ-Dawn
Chrome 123
- תמיכה בפונקציות מובנות של DP4a ב-WGSL
- פרמטרים של מצביעים ללא הגבלה ב-WGSL
- Syntax sugar for dereferencing composites in WGSL
- מצב נפרד של קריאה בלבד לסטנסיל ולעומק
- עדכונים מ-Dawn
Chrome 122
- הרחבת פוטנציאל החשיפה באמצעות מצב תאימות (תכונה בפיתוח)
- הגדלת המגבלה של maxVertexAttributes
- עדכונים מ-Dawn
Chrome 121
- תמיכה ב-WebGPU ב-Android
- שימוש ב-DXC במקום ב-FXC להידור של shader ב-Windows
- שאילתות של חותמות זמן במעברים של חישוב ועיבוד
- נקודות כניסה שמוגדרות כברירת מחדל למודולים של Shader
- תמיכה ב-display-p3 כמרחב צבעים של GPUExternalTexture
- פרטי ערימות הזיכרון
- עדכונים מ-Dawn
Chrome 120
- תמיכה בערכי נקודה צפה (floating-point) של 16 ביט ב-WGSL
- בוחנים את הגבולות
- שינויים במצב של stencil עומק
- עדכונים בפרטי המתאם
- קוונטיזציה של שאילתות עם חותמות זמן
- תכונות לניקוי פסח
Chrome 119
- טקסטורות של מספר ממשי (float) ב-32 ביט שאפשר לסנן
- פורמט קודקודים unorm10-10-10-2
- פורמט טקסטורה rgb10a2uint
- עדכונים מ-Dawn
Chrome 118
- תמיכה ב-HTMLImageElement וב-ImageData ב-
copyExternalImageToTexture()
- תמיכה ניסיונית בטקסטורת אחסון לקריאה/כתיבה ולקריאה בלבד
- עדכונים מ-Dawn
Chrome 117
- Unset vertex buffer
- ביטול ההגדרה של קבוצת קישור
- השבתת שגיאות מיצירת צינורות אסינכרוניים כשהמכשיר אבד
- עדכונים ביצירת מודול shader של SPIR-V
- שיפור חוויית המפתחים
- שמירת צינורות לעיבוד נתונים במטמון עם פריסה שנוצרת באופן אוטומטי
- עדכונים מ-Dawn
Chrome 116
- שילוב של WebCodecs
- המאפיין isFallbackAdapter של GPUAdapter
requestDevice()
- הפעלה חלקה של סרטונים אם מתקשרים אל
importExternalTexture()
- התאמה למפרט
- שיפור חוויית המפתחים
- עדכונים מ-Dawn
Chrome 115
- תוספים נתמכים לשפת WGSL
- תמיכה ניסיונית ב-Direct3D 11
- קבלת GPU נפרד כברירת מחדל בהפעלה באמצעות מתח AC
- שיפור חוויית המפתחים
- עדכונים מ-Dawn
Chrome 114
- אופטימיזציה של JavaScript
- getCurrentTexture() ב-canvas לא מוגדר מעלה InvalidStateError
- עדכונים ב-WGSL
- עדכונים מ-Dawn