ভিডিও স্ট্রিম উপাদান ম্যানিপুলেট।
আধুনিক ওয়েব প্রযুক্তি ভিডিওর সাথে কাজ করার যথেষ্ট উপায় প্রদান করে। মিডিয়া স্ট্রিম এপিআই , মিডিয়া রেকর্ডিং এপিআই , মিডিয়া সোর্স এপিআই , এবং ওয়েবআরটিসি এপিআই ভিডিও স্ট্রিম রেকর্ডিং, স্থানান্তর এবং প্লে করার জন্য একটি সমৃদ্ধ টুল সেট করে। নির্দিষ্ট উচ্চ-স্তরের কাজগুলি সমাধান করার সময়, এই APIগুলি ওয়েব প্রোগ্রামারদের একটি ভিডিও স্ট্রিমের পৃথক উপাদান যেমন ফ্রেম এবং এনকোড করা ভিডিও বা অডিওর আনমক্সড অংশগুলির সাথে কাজ করতে দেয় না। এই মৌলিক উপাদানগুলিতে নিম্ন-স্তরের অ্যাক্সেস পেতে, বিকাশকারীরা ব্রাউজারে ভিডিও এবং অডিও কোডেক আনতে WebAssembly ব্যবহার করছে। কিন্তু প্রদত্ত যে আধুনিক ব্রাউজারগুলি ইতিমধ্যেই বিভিন্ন ধরণের কোডেক (যা প্রায়শই হার্ডওয়্যার দ্বারা ত্বরান্বিত হয়) সহ পাঠানো হয়, সেগুলিকে WebAssembly হিসাবে পুনরায় প্যাকেজ করা মানব এবং কম্পিউটার সম্পদের অপচয় বলে মনে হয়।
WebCodecs API প্রোগ্রামারদের ইতিমধ্যে ব্রাউজারে উপস্থিত মিডিয়া উপাদানগুলি ব্যবহার করার একটি উপায় দিয়ে এই অদক্ষতা দূর করে৷ বিশেষভাবে:
- ভিডিও এবং অডিও ডিকোডার
- ভিডিও এবং অডিও এনকোডার
- কাঁচা ভিডিও ফ্রেম
- ইমেজ ডিকোডার
WebCodecs API ওয়েব অ্যাপ্লিকেশনগুলির জন্য উপযোগী যেগুলির জন্য মিডিয়া বিষয়বস্তু প্রক্রিয়াকরণের সম্পূর্ণ নিয়ন্ত্রণ প্রয়োজন, যেমন ভিডিও সম্পাদক, ভিডিও কনফারেন্সিং, ভিডিও স্ট্রিমিং ইত্যাদি।
ভিডিও প্রক্রিয়াকরণ কর্মপ্রবাহ
ফ্রেম হল ভিডিও প্রক্রিয়াকরণের কেন্দ্রবিন্দু। এইভাবে ওয়েবকোডেক্সে বেশিরভাগ ক্লাস হয় ফ্রেম ব্যবহার করে বা উত্পাদন করে। ভিডিও এনকোডার ফ্রেমকে এনকোড করা খণ্ডে রূপান্তর করে। ভিডিও ডিকোডার বিপরীত কাজ.
এছাড়াও VideoFrame
একটি CanvasImageSource
হয়ে এবং CanvasImageSource
গ্রহণ করে এমন একটি কনস্ট্রাক্টর থাকার মাধ্যমে অন্যান্য ওয়েব API-এর সাথে সুন্দরভাবে খেলে৷ তাই এটি drawImage()
এবং texImage2D()
মতো ফাংশনে ব্যবহার করা যেতে পারে। এছাড়াও এটি ক্যানভাস, বিটম্যাপ, ভিডিও উপাদান এবং অন্যান্য ভিডিও ফ্রেম থেকে তৈরি করা যেতে পারে।
WebCodecs API ইনসার্টেবল স্ট্রীমস এপিআই- এর ক্লাসের সাথে ভালোভাবে কাজ করে যা WebCodecs কে মিডিয়া স্ট্রিম ট্র্যাকের সাথে সংযুক্ত করে।
-
MediaStreamTrackProcessor
মিডিয়া ট্র্যাকগুলিকে পৃথক ফ্রেমে ভেঙে দেয়। -
MediaStreamTrackGenerator
ফ্রেমের একটি স্ট্রীম থেকে একটি মিডিয়া ট্র্যাক তৈরি করে।
WebCodecs এবং ওয়েব কর্মীরা
ডিজাইনের দ্বারা WebCodecs API সমস্ত ভারী উত্তোলন অ্যাসিঙ্ক্রোনাসভাবে এবং মূল থ্রেডের বাইরে করে। কিন্তু যেহেতু ফ্রেম এবং খণ্ড কলব্যাকগুলি প্রায়শই সেকেন্ডে একাধিকবার কল করা যেতে পারে, তাই তারা মূল থ্রেডকে বিশৃঙ্খল করতে পারে এবং এইভাবে ওয়েবসাইটটিকে কম প্রতিক্রিয়াশীল করে তুলতে পারে। তাই পৃথক ফ্রেম এবং এনকোড করা অংশগুলির হ্যান্ডলিংকে ওয়েব ওয়ার্কারে স্থানান্তর করা বাঞ্ছনীয়৷
এটিতে সহায়তা করার জন্য, ReadableStream একটি মিডিয়া ট্র্যাক থেকে কর্মীকে স্বয়ংক্রিয়ভাবে সমস্ত ফ্রেম স্থানান্তর করার একটি সুবিধাজনক উপায় প্রদান করে৷ উদাহরণস্বরূপ, MediaStreamTrackProcessor
ওয়েব ক্যামেরা থেকে আসা একটি মিডিয়া স্ট্রিম ট্র্যাকের জন্য একটি ReadableStream
পেতে ব্যবহার করা যেতে পারে। এর পরে স্ট্রীমটি একটি ওয়েব ওয়ার্কারের কাছে স্থানান্তরিত হয় যেখানে ফ্রেমগুলি একে একে পড়া হয় এবং একটি VideoEncoder
সারিবদ্ধ করা হয়৷
HTMLCanvasElement.transferControlToOffscreen
দিয়ে এমনকি মূল থ্রেডের বাইরেও রেন্ডারিং করা যায়। কিন্তু যদি সমস্ত উচ্চ স্তরের সরঞ্জামগুলি অসুবিধাজনক বলে প্রমাণিত হয়, VideoFrame
নিজেই স্থানান্তরযোগ্য এবং কর্মীদের মধ্যে স্থানান্তরিত হতে পারে৷
কর্মে ওয়েবকোডেক্স
এনকোডিং
এটি সব একটি VideoFrame
দিয়ে শুরু হয়। ভিডিও ফ্রেম নির্মাণের তিনটি উপায় আছে।
একটি ক্যানভাস, একটি চিত্র বিটম্যাপ, বা একটি ভিডিও উপাদানের মতো একটি চিত্র উত্স থেকে৷
const canvas = document.createElement("canvas"); // Draw something on the canvas... const frameFromCanvas = new VideoFrame(canvas, { timestamp: 0 });
একটি
MediaStreamTrack
থেকে ফ্রেম টানতেMediaStreamTrackProcessor
ব্যবহার করুনconst stream = await navigator.mediaDevices.getUserMedia({…}); const track = stream.getTracks()[0]; const trackProcessor = new MediaStreamTrackProcessor(track); const reader = trackProcessor.readable.getReader(); while (true) { const result = await reader.read(); if (result.done) break; const frameFromCamera = result.value; }
BufferSource
এর বাইনারি পিক্সেল উপস্থাপনা থেকে একটি ফ্রেম তৈরি করুনconst pixelSize = 4; const init = { timestamp: 0, codedWidth: 320, codedHeight: 200, format: "RGBA", }; const data = new Uint8Array(init.codedWidth * init.codedHeight * pixelSize); for (let x = 0; x < init.codedWidth; x++) { for (let y = 0; y < init.codedHeight; y++) { const offset = (y * init.codedWidth + x) * pixelSize; data[offset] = 0x7f; // Red data[offset + 1] = 0xff; // Green data[offset + 2] = 0xd4; // Blue data[offset + 3] = 0x0ff; // Alpha } } const frame = new VideoFrame(data, init);
সেগুলি যেখান থেকে আসছে না কেন, একটি VideoEncoder
দিয়ে ফ্রেমগুলিকে EncodedVideoChunk
অবজেক্টে এনকোড করা যেতে পারে৷
এনকোডিংয়ের আগে, VideoEncoder
দুটি জাভাস্ক্রিপ্ট অবজেক্ট দিতে হবে:
- এনকোড করা অংশ এবং ত্রুটিগুলি পরিচালনা করার জন্য দুটি ফাংশন সহ Init অভিধান। এই ফাংশনগুলি ডেভেলপার-সংজ্ঞায়িত এবং
VideoEncoder
কনস্ট্রাক্টরে পাস করার পরে পরিবর্তন করা যাবে না। - এনকোডার কনফিগারেশন অবজেক্ট, যা আউটপুট ভিডিও স্ট্রীমের জন্য পরামিতি ধারণ করে। আপনি
configure()
কল করে পরে এই পরামিতিগুলি পরিবর্তন করতে পারেন।
configure()
পদ্ধতিটি NotSupportedError
নিক্ষেপ করবে যদি কনফিগার ব্রাউজার দ্বারা সমর্থিত না হয়। কনফিগার সমর্থিত কিনা তা আগে থেকে পরীক্ষা করার জন্য আপনাকে কনফিগার সহ স্ট্যাটিক পদ্ধতি VideoEncoder.isConfigSupported()
কল করতে এবং এর প্রতিশ্রুতির জন্য অপেক্ষা করতে উত্সাহিত করা হচ্ছে।
const init = {
output: handleChunk,
error: (e) => {
console.log(e.message);
},
};
const config = {
codec: "vp8",
width: 640,
height: 480,
bitrate: 2_000_000, // 2 Mbps
framerate: 30,
};
const { supported } = await VideoEncoder.isConfigSupported(config);
if (supported) {
const encoder = new VideoEncoder(init);
encoder.configure(config);
} else {
// Try another config.
}
এনকোডার সেট আপ করার পরে, এটি encode()
পদ্ধতির মাধ্যমে ফ্রেম গ্রহণ করার জন্য প্রস্তুত। configure()
এবং encode()
উভয়ই প্রকৃত কাজ শেষ হওয়ার জন্য অপেক্ষা না করে অবিলম্বে ফিরে আসে। এটি একই সময়ে এনকোডিংয়ের জন্য একাধিক ফ্রেমকে সারিবদ্ধ করার অনুমতি দেয়, যখন encodeQueueSize
দেখায় যে আগের এনকোডগুলি শেষ হওয়ার জন্য সারিতে কতগুলি অনুরোধ অপেক্ষা করছে৷ ত্রুটিগুলি হয় অবিলম্বে একটি ব্যতিক্রম নিক্ষেপ করে রিপোর্ট করা হয়, যদি আর্গুমেন্ট বা পদ্ধতি কলের ক্রম API চুক্তি লঙ্ঘন করে, অথবা কোডেক বাস্তবায়নে সমস্যাগুলির জন্য error()
কলব্যাক কল করে। এনকোডিং সফলভাবে সম্পন্ন হলে output()
কলব্যাককে একটি আর্গুমেন্ট হিসাবে একটি নতুন এনকোড করা অংশের সাথে কল করা হয়। এখানে আরেকটি গুরুত্বপূর্ণ বিশদটি হল যে ফ্রেমগুলিকে বলা দরকার যখন তাদের আর প্রয়োজন হয় না close()
কল করে।
let frameCounter = 0;
const track = stream.getVideoTracks()[0];
const trackProcessor = new MediaStreamTrackProcessor(track);
const reader = trackProcessor.readable.getReader();
while (true) {
const result = await reader.read();
if (result.done) break;
const frame = result.value;
if (encoder.encodeQueueSize > 2) {
// Too many frames in flight, encoder is overwhelmed
// let's drop this frame.
frame.close();
} else {
frameCounter++;
const keyFrame = frameCounter % 150 == 0;
encoder.encode(frame, { keyFrame });
frame.close();
}
}
অবশেষে এটি একটি ফাংশন লিখে এনকোডিং কোড শেষ করার সময় যা এনকোডার থেকে বেরিয়ে আসার সাথে সাথে এনকোড করা ভিডিওর অংশগুলি পরিচালনা করে। সাধারণত এই ফাংশনটি নেটওয়ার্কে ডেটা খণ্ডগুলি প্রেরণ করবে বা স্টোরেজের জন্য একটি মিডিয়া কন্টেইনারে মিক্স করবে ।
function handleChunk(chunk, metadata) {
if (metadata.decoderConfig) {
// Decoder needs to be configured (or reconfigured) with new parameters
// when metadata has a new decoderConfig.
// Usually it happens in the beginning or when the encoder has a new
// codec specific binary configuration. (VideoDecoderConfig.description).
fetch("/upload_extra_data", {
method: "POST",
headers: { "Content-Type": "application/octet-stream" },
body: metadata.decoderConfig.description,
});
}
// actual bytes of encoded data
const chunkData = new Uint8Array(chunk.byteLength);
chunk.copyTo(chunkData);
fetch(`/upload_chunk?timestamp=${chunk.timestamp}&type=${chunk.type}`, {
method: "POST",
headers: { "Content-Type": "application/octet-stream" },
body: chunkData,
});
}
যদি কোনও সময়ে আপনাকে নিশ্চিত করতে হয় যে সমস্ত মুলতুবি থাকা এনকোডিং অনুরোধগুলি সম্পূর্ণ হয়েছে, আপনি flush()
কল করতে পারেন এবং এর প্রতিশ্রুতির জন্য অপেক্ষা করতে পারেন।
await encoder.flush();
ডিকোডিং
একটি VideoDecoder
সেট আপ করা VideoEncoder
এর জন্য যা করা হয়েছে তার অনুরূপ: যখন ডিকোডার তৈরি করা হয় তখন দুটি ফাংশন পাস হয়, এবং কোডেক প্যারামিটারগুলি configure()
এর জন্য দেওয়া হয়।
কোডেক প্যারামিটারের সেট কোডেক থেকে কোডেকে পরিবর্তিত হয়। উদাহরণস্বরূপ H.264 কোডেক-এর জন্য AVCC-এর একটি বাইনারি ব্লব প্রয়োজন হতে পারে, যদি না এটি তথাকথিত Annex B ফর্ম্যাটে এনকোড করা হয় ( encoderConfig.avc = { format: "annexb" }
)।
const init = {
output: handleFrame,
error: (e) => {
console.log(e.message);
},
};
const config = {
codec: "vp8",
codedWidth: 640,
codedHeight: 480,
};
const { supported } = await VideoDecoder.isConfigSupported(config);
if (supported) {
const decoder = new VideoDecoder(init);
decoder.configure(config);
} else {
// Try another config.
}
একবার ডিকোডারটি আরম্ভ হয়ে গেলে, আপনি এটিকে EncodedVideoChunk
অবজেক্টের সাথে খাওয়ানো শুরু করতে পারেন। একটি খণ্ড তৈরি করতে, আপনার প্রয়োজন হবে:
- এনকোড করা ভিডিও ডেটার একটি
BufferSource
- খণ্ডের স্টার্ট টাইমস্ট্যাম্প মাইক্রোসেকেন্ডে (খণ্ডে প্রথম এনকোড করা ফ্রেমের মিডিয়া সময়)
- খণ্ডের ধরন, এক:
-
key
যদি খণ্ডটিকে আগের খণ্ডগুলি থেকে স্বাধীনভাবে ডিকোড করা যায় -
delta
যদি এক বা একাধিক পূর্ববর্তী অংশগুলিকে ডিকোড করার পরে শুধুমাত্র খণ্ডটি ডিকোড করা যায়
-
এছাড়াও এনকোডার দ্বারা নির্গত যেকোন অংশগুলি ডিকোডারের জন্য প্রস্তুত। ত্রুটি রিপোর্টিং এবং এনকোডারের পদ্ধতিগুলির অ্যাসিঙ্ক্রোনাস প্রকৃতি সম্পর্কে উপরে বলা সমস্ত জিনিস ডিকোডারগুলির জন্যও সমানভাবে সত্য।
const responses = await downloadVideoChunksFromServer(timestamp);
for (let i = 0; i < responses.length; i++) {
const chunk = new EncodedVideoChunk({
timestamp: responses[i].timestamp,
type: responses[i].key ? "key" : "delta",
data: new Uint8Array(responses[i].body),
});
decoder.decode(chunk);
}
await decoder.flush();
এখন এটি দেখানোর সময় যে কিভাবে একটি নতুন ডিকোড করা ফ্রেম পৃষ্ঠায় দেখানো যেতে পারে। ডিকোডার আউটপুট কলব্যাক ( handleFrame()
) দ্রুত ফিরে আসে তা নিশ্চিত করা ভাল। নীচের উদাহরণে, এটি শুধুমাত্র রেন্ডারিংয়ের জন্য প্রস্তুত ফ্রেমের সারিতে একটি ফ্রেম যোগ করে। রেন্ডারিং আলাদাভাবে ঘটে এবং দুটি ধাপ নিয়ে গঠিত:
- ফ্রেম দেখানোর জন্য সঠিক সময়ের অপেক্ষা।
- ক্যানভাসে ফ্রেম আঁকা।
ফ্রেমের আর প্রয়োজন না হলে, আবর্জনা সংগ্রহকারীর কাছে যাওয়ার আগে অন্তর্নিহিত মেমরি প্রকাশ করতে close()
কল করুন, এটি ওয়েব অ্যাপ্লিকেশন দ্বারা ব্যবহৃত মেমরির গড় পরিমাণ হ্রাস করবে।
const canvas = document.getElementById("canvas");
const ctx = canvas.getContext("2d");
let pendingFrames = [];
let underflow = true;
let baseTime = 0;
function handleFrame(frame) {
pendingFrames.push(frame);
if (underflow) setTimeout(renderFrame, 0);
}
function calculateTimeUntilNextFrame(timestamp) {
if (baseTime == 0) baseTime = performance.now();
let mediaTime = performance.now() - baseTime;
return Math.max(0, timestamp / 1000 - mediaTime);
}
async function renderFrame() {
underflow = pendingFrames.length == 0;
if (underflow) return;
const frame = pendingFrames.shift();
// Based on the frame's timestamp calculate how much of real time waiting
// is needed before showing the next frame.
const timeUntilNextFrame = calculateTimeUntilNextFrame(frame.timestamp);
await new Promise((r) => {
setTimeout(r, timeUntilNextFrame);
});
ctx.drawImage(frame, 0, 0);
frame.close();
// Immediately schedule rendering of the next frame
setTimeout(renderFrame, 0);
}
দেব টিপস
মিডিয়া লগ দেখতে এবং WebCodecs ডিবাগ করতে Chrome DevTools-এ মিডিয়া প্যানেল ব্যবহার করুন৷
ডেমো
নীচের ডেমোটি দেখায় যে ক্যানভাস থেকে অ্যানিমেশন ফ্রেমগুলি কেমন হয়:
-
MediaStreamTrackProcessor
দ্বারা একটিReadableStream
25fps এ ক্যাপচার করা হয়েছে - একজন ওয়েব কর্মীর কাছে স্থানান্তরিত হয়েছে
- H.264 ভিডিও ফরম্যাটে এনকোড করা হয়েছে
- ভিডিও ফ্রেমের ক্রমানুসারে আবার ডিকোড করা হয়েছে
- এবং
transferControlToOffscreen()
ব্যবহার করে দ্বিতীয় ক্যানভাসে রেন্ডার করা হয়েছে
অন্যান্য ডেমো
এছাড়াও আমাদের অন্যান্য ডেমো দেখুন:
- ইমেজডিকোডার দিয়ে জিআইএফ ডিকোডিং
- একটি ফাইলে ক্যামেরা ইনপুট ক্যাপচার করুন
- MP4 প্লেব্যাক
- অন্যান্য নমুনা
WebCodecs API ব্যবহার করে
বৈশিষ্ট্য সনাক্তকরণ
WebCodecs সমর্থন চেক করতে:
if ('VideoEncoder' in window) {
// WebCodecs API is supported.
}
মনে রাখবেন WebCodecs API শুধুমাত্র সুরক্ষিত প্রসঙ্গে উপলব্ধ, তাই self.isSecureContext
মিথ্যা হলে সনাক্তকরণ ব্যর্থ হবে।
প্রতিক্রিয়া
Chrome টিম WebCodecs API এর সাথে আপনার অভিজ্ঞতার কথা শুনতে চায়৷
API ডিজাইন সম্পর্কে আমাদের বলুন
API সম্পর্কে এমন কিছু আছে যা আপনার প্রত্যাশিত মত কাজ করে না? অথবা আপনার ধারণা বাস্তবায়নের জন্য আপনার প্রয়োজনীয় পদ্ধতি বা বৈশিষ্ট্যগুলি অনুপস্থিত আছে? নিরাপত্তা মডেল সম্পর্কে একটি প্রশ্ন বা মন্তব্য আছে? সংশ্লিষ্ট গিটহাব রেপোতে একটি বিশেষ সমস্যা ফাইল করুন, বা বিদ্যমান সমস্যাটিতে আপনার চিন্তা যোগ করুন।
বাস্তবায়নের সাথে একটি সমস্যা রিপোর্ট করুন
আপনি কি Chrome এর বাস্তবায়নের সাথে একটি বাগ খুঁজে পেয়েছেন? অথবা বাস্তবায়ন বৈশিষ্ট থেকে ভিন্ন? new.crbug.com এ একটি বাগ ফাইল করুন। আপনি যতটা পারেন বিস্তারিত, পুনরুত্পাদনের জন্য সহজ নির্দেশাবলী, এবং উপাদান বাক্সে Blink>Media>WebCodecs
লিখতে ভুলবেন না। দ্রুত এবং সহজ রিপ্রো শেয়ার করার জন্য গ্লিচ দুর্দান্ত কাজ করে।
API এর জন্য সমর্থন দেখান
আপনি WebCodecs API ব্যবহার করার পরিকল্পনা করছেন? আপনার সর্বজনীন সমর্থন Chrome টিমকে বৈশিষ্ট্যগুলিকে অগ্রাধিকার দিতে সাহায্য করে এবং অন্যান্য ব্রাউজার বিক্রেতাদের দেখায় যে তাদের সমর্থন করা কতটা গুরুত্বপূর্ণ৷
media-dev@chromium.org- এ ইমেল পাঠান বা #WebCodecs
হ্যাশট্যাগ ব্যবহার করে @ChromiumDev- এ একটি টুইট পাঠান এবং আপনি এটি কোথায় এবং কীভাবে ব্যবহার করছেন তা আমাদের জানান।