chrome.ttsEngine

বর্ণনা

একটি এক্সটেনশন ব্যবহার করে একটি টেক্সট-টু-স্পীচ (TTS) ইঞ্জিন বাস্তবায়ন করতে chrome.ttsEngine API ব্যবহার করুন৷ যদি আপনার এক্সটেনশনটি এই API ব্যবহার করে নিবন্ধন করে, এটি একটি উচ্চারণ এবং অন্যান্য পরামিতি সম্বলিত ইভেন্টগুলি পাবে যখন কোনো এক্সটেনশন বা Chrome অ্যাপ স্পিচ তৈরি করতে tts API ব্যবহার করে। আপনার এক্সটেনশনটি তখন বক্তৃতা সংশ্লেষিত এবং আউটপুট করার জন্য যেকোন উপলব্ধ ওয়েব প্রযুক্তি ব্যবহার করতে পারে এবং স্থিতি প্রতিবেদন করতে ইভেন্টগুলিকে কলিং ফাংশনে ফেরত পাঠাতে পারে।

অনুমতি

ttsEngine

ধারণা এবং ব্যবহার

একটি এক্সটেনশন একটি বক্তৃতা ইঞ্জিন হিসাবে নিজেকে নিবন্ধন করতে পারেন. এটি করার মাধ্যমে, এটি tts.speak() এবং tts.stop() এর মতো ফাংশনে কিছু বা সমস্ত কল বাধা দিতে পারে এবং একটি বিকল্প বাস্তবায়ন প্রদান করতে পারে। এক্সটেনশনগুলি সার্ভার থেকে স্ট্রিমিং অডিও, HTML5 অডিও সহ বক্তৃতা প্রদানের জন্য যেকোন উপলব্ধ ওয়েব প্রযুক্তি ব্যবহার করার জন্য বিনামূল্যে। একটি এক্সটেনশন এমনকি উচ্চারণের সাথে ভিন্ন কিছু করতে পারে, যেমন একটি পপআপে ক্লোজড ক্যাপশন প্রদর্শন করা বা দূরবর্তী সার্ভারে লগ বার্তা হিসাবে প্রেরণ করা।

একটি TTS ইঞ্জিন বাস্তবায়ন করতে, একটি এক্সটেনশনকে অবশ্যই "ttsEngine" অনুমতি ঘোষণা করতে হবে এবং তারপরে এক্সটেনশন ম্যানিফেস্টে এটি প্রদান করে এমন সমস্ত ভয়েস ঘোষণা করতে হবে, যেমন:

{
  "name": "My TTS Engine",
  "version": "1.0",
  "permissions": ["ttsEngine"],
  "tts_engine": {
    "voices": [
      {
        "voice_name": "Alice",
        "lang": "en-US",
        "event_types": ["start", "marker", "end"]
      },
      {
        "voice_name": "Pat",
        "lang": "en-US",
        "event_types": ["end"]
      }
    ]
  },
  "background": {
    "page": "background.html",
    "persistent": false
  }
}

একটি এক্সটেনশন যেকোনো সংখ্যক ভয়েস নির্দিষ্ট করতে পারে।

voice_name প্যারামিটার প্রয়োজন। নামটি যথেষ্ট বর্ণনামূলক হওয়া উচিত যাতে এটি ভয়েসের নাম এবং ব্যবহৃত ইঞ্জিন সনাক্ত করে। অসম্ভাব্য ঘটনা যে দুটি এক্সটেনশন একই নামের সাথে ভয়েস নিবন্ধন করে, একজন ক্লায়েন্ট এক্সটেনশনের আইডি নির্দিষ্ট করতে পারে যা সংশ্লেষণ করবে।

lang প্যারামিটারটি ঐচ্ছিক, কিন্তু অত্যন্ত প্রস্তাবিত। প্রায় সবসময়, একটি ভয়েস শুধুমাত্র একটি একক ভাষায় বক্তৃতা সংশ্লেষিত করতে পারে। যখন একটি ইঞ্জিন একাধিক ভাষা সমর্থন করে, তখন এটি সহজেই প্রতিটি ভাষার জন্য একটি পৃথক ভয়েস নিবন্ধন করতে পারে। বিরল পরিস্থিতিতে যেখানে একটি একক ভয়েস একাধিক ভাষা পরিচালনা করতে পারে, সেখানে দুটি পৃথক ভয়েস তালিকাভুক্ত করা এবং অভ্যন্তরীণভাবে একই যুক্তি ব্যবহার করে তাদের পরিচালনা করা সবচেয়ে সহজ। যাইহোক, আপনি যদি এমন একটি ভয়েস তৈরি করতে চান যা যেকোনো ভাষায় উচ্চারণ পরিচালনা করবে, তাহলে আপনার এক্সটেনশনের ম্যানিফেস্ট থেকে lang প্যারামিটারটি বাদ দিন।

অবশেষে, যদি ইঞ্জিনটি স্পিচ সংশ্লেষণের অগ্রগতি সম্পর্কে ক্লায়েন্টকে আপডেট করার জন্য ইভেন্ট পাঠাতে পারে তাহলে event_types প্যারামিটার প্রয়োজন। ন্যূনতম, বক্তৃতা শেষ হওয়ার সময় নির্দেশ করার জন্য 'end' ইভেন্ট টাইপকে সমর্থন করা অত্যন্ত সুপারিশ করা হয়, অন্যথায় Chrome সারিবদ্ধ উচ্চারণগুলি নির্ধারণ করতে পারে না৷

একবার লোড হয়ে গেলে, একটি এক্সটেনশন chrome.ttsEngine.updateVoices কল করে ঘোষিত ভয়েসের তালিকা প্রতিস্থাপন করতে পারে। (উল্লেখ্য যে updateVoices জন্য প্রোগ্রামেটিক কলে ব্যবহৃত প্যারামিটারগুলি উটের ক্ষেত্রে রয়েছে: যেমন, voiceName , ম্যানিফেস্ট ফাইলের বিপরীতে যা voice_name ব্যবহার করে।)

সম্ভাব্য ইভেন্টের ধরনগুলি যা আপনি পাঠাতে পারেন speak() পদ্ধতিটি যে ইভেন্ট প্রকারগুলি গ্রহণ করে তার সাথে মিলে যায়:

  • 'start' : ইঞ্জিনটি উচ্চারণ বলতে শুরু করেছে।
  • 'word' : একটি শব্দের সীমারেখা পৌঁছে গেছে। বর্তমান বক্তৃতা অবস্থান নির্ধারণ করতে event.charIndex ব্যবহার করুন।
  • 'sentence' : একটি বাক্যের সীমারেখা পৌঁছেছে। বর্তমান বক্তৃতা অবস্থান নির্ধারণ করতে event.charIndex ব্যবহার করুন।
  • 'marker' : একটি SSML মার্কার পৌঁছেছে। বর্তমান বক্তৃতা অবস্থান নির্ধারণ করতে event.charIndex ব্যবহার করুন।
  • 'end' : ইঞ্জিনটি উচ্চারণটি বলা শেষ করেছে।
  • 'error' : একটি ইঞ্জিন-নির্দিষ্ট ত্রুটি ঘটেছে এবং এই উচ্চারণটি বলা যাবে না। event.errorMessage এ আরও তথ্য পাঠান।

'interrupted' এবং 'cancelled' ইভেন্টগুলি স্পিচ ইঞ্জিন দ্বারা পাঠানো হয় না; এগুলি Chrome দ্বারা স্বয়ংক্রিয়ভাবে তৈরি হয়৷

টেক্সট-টু-স্পিচ ক্লায়েন্টরা tts.getVoices এ কল করে আপনার এক্সটেনশনের ম্যানিফেস্ট থেকে ভয়েস তথ্য পেতে পারে, ধরে নিই যে আপনি নীচে বর্ণিত হিসাবে বক্তৃতা ইভেন্ট শ্রোতাদের নিবন্ধিত করেছেন।

বক্তৃতা ইভেন্টগুলি পরিচালনা করুন

ক্লায়েন্টদের অনুরোধে বক্তৃতা তৈরি করতে, আপনার এক্সটেনশনটিকে অবশ্যই onSpeak এবং onStop উভয়ের জন্য শ্রোতাদের নিবন্ধন করতে হবে, যেমন:

const speakListener = (utterance, options, sendTtsEvent) => {
  sendTtsEvent({type: 'start', charIndex: 0})

  // (start speaking)

  sendTtsEvent({type: 'end', charIndex: utterance.length})
};

const stopListener = () => {
  // (stop all speech)
};

chrome.ttsEngine.onSpeak.addListener(speakListener);
chrome.ttsEngine.onStop.addListener(stopListener);

একটি এক্সটেনশনে প্রদত্ত স্পিচ রিকোয়েস্ট পাঠানো হবে কি না তার সিদ্ধান্ত শুধুমাত্র এক্সটেনশনটি তার ম্যানিফেস্টে প্রদত্ত ভয়েস প্যারামিটার সমর্থন করে কিনা এবং onSpeak এবং onStop এর জন্য শ্রোতাদের নিবন্ধিত করেছে কিনা তার উপর ভিত্তি করে। অন্য কথায়, একটি এক্সটেনশনের জন্য একটি বক্তৃতা অনুরোধ গ্রহণ করার এবং গতিশীলভাবে এটি পরিচালনা করা হবে কিনা তা সিদ্ধান্ত নেওয়ার কোন উপায় নেই।

প্রকারভেদ

AudioBuffer

Chrome 92+

একটি অডিও বাফার এবং সংশ্লিষ্ট ডেটা ধারণকারী পরামিতি।

বৈশিষ্ট্য

  • অডিওবাফার

    অ্যারেবাফার

    টেক্সট-টু-স্পীচ ইঞ্জিন থেকে অডিও বাফার। এটির দৈর্ঘ্য ঠিক audioStreamOptions.bufferSize হওয়া উচিত এবং mono হিসাবে এনকোড করা, audioStreamOptions.sampleRate, এবং লিনিয়ার pcm হিসাবে, 32-বিট স্বাক্ষরিত ফ্লোট অর্থাৎ জাভাস্ক্রিপ্টে Float32Array টাইপ।

  • charIndex

    সংখ্যা ঐচ্ছিক

    এই অডিও বাফারের সাথে যুক্ত অক্ষর সূচক।

  • লাস্টবাফার

    বুলিয়ান ঐচ্ছিক

    সত্য যদি এই অডিও বাফারটি উচ্চারিত পাঠ্যের জন্য শেষ হয়।

AudioStreamOptions

Chrome 92+

একটি ইঞ্জিন দ্বারা উত্পাদিত হবে বলে প্রত্যাশিত অডিও স্ট্রিম বিন্যাস রয়েছে৷

বৈশিষ্ট্য

  • বাফার সাইজ

    সংখ্যা

    একটি অডিও বাফারের মধ্যে নমুনার সংখ্যা।

  • নমুনা হার

    সংখ্যা

    একটি অডিও বাফারে প্রত্যাশিত নমুনা হার৷

LanguageInstallStatus

মুলতুবি

একটি ভয়েস ইনস্টল অবস্থা.

এনাম

"ইনস্টল করা হয়নি"

"ইনস্টল করা হচ্ছে"

"ইনস্টল করা"

"ব্যর্থ"

LanguageStatus

মুলতুবি

একটি ভাষার স্থিতি ইনস্টল করুন।

বৈশিষ্ট্য

  • ত্রুটি

    স্ট্রিং ঐচ্ছিক

    ইনস্টলেশন ব্যর্থতা সম্পর্কে বিস্তারিত. ভাষা ইনস্টল করতে ব্যর্থ হলে ঐচ্ছিকভাবে জনবহুল।

  • ইন্সটল স্ট্যাটাস

    ইনস্টলেশন অবস্থা।

  • lang

    স্ট্রিং

    ভাষা স্ট্রিং ফর্ম ভাষা কোড-অঞ্চল কোড, যেখানে অঞ্চল বাদ দেওয়া হতে পারে। উদাহরণ হল en, en-AU, zh-CH.

SpeakOptions

Chrome 92+

tts.speak() পদ্ধতিতে নির্দিষ্ট বিকল্পগুলি।

বৈশিষ্ট্য

  • লিঙ্গ
    ক্রোম 92 থেকে অবরুদ্ধ

    লিঙ্গ অবজ্ঞা করা হয়েছে এবং উপেক্ষা করা হবে।

    সংশ্লেষিত বক্তৃতা জন্য ভয়েস লিঙ্গ.

  • lang

    স্ট্রিং ঐচ্ছিক

    সংশ্লেষণের জন্য যে ভাষাটি ব্যবহার করা হবে, ভাষা আকারে - অঞ্চল । উদাহরণ: 'en', 'en-US', 'en-GB', 'zh-CN'।

  • পিচ

    সংখ্যা ঐচ্ছিক

    0 এবং 2 এর মধ্যে স্পিকিং পিচ অন্তর্ভুক্ত, 0 সর্বনিম্ন এবং 2 সর্বোচ্চ। 1.0 এই ভয়েসের ডিফল্ট পিচের সাথে মিলে যায়।

  • হার

    সংখ্যা ঐচ্ছিক

    এই ভয়েসের জন্য ডিফল্ট হারের তুলনায় কথা বলার হার। 1.0 হল ডিফল্ট হার, সাধারণত প্রতি মিনিটে প্রায় 180 থেকে 220 শব্দ। 2.0 এর দ্বিগুণ দ্রুত এবং 0.5 এর অর্ধেক দ্রুত। এই মানটি 0.1 এবং 10.0 এর মধ্যে থাকার নিশ্চয়তা, অন্তর্ভুক্ত। যখন একটি ভয়েস এই সম্পূর্ণ পরিসরের হার সমর্থন করে না, তখন একটি ত্রুটি ফেরত দেবেন না। পরিবর্তে, ভয়েস সমর্থন করে এমন রেঞ্জে হার ক্লিপ করুন।

  • ভয়েস নাম

    স্ট্রিং ঐচ্ছিক

    সংশ্লেষণের জন্য ব্যবহার করা ভয়েসের নাম।

  • আয়তন

    সংখ্যা ঐচ্ছিক

    0 এবং 1 এর মধ্যে স্পিকিং ভলিউম অন্তর্ভুক্ত, 0 সর্বনিম্ন এবং 1 সর্বোচ্চ, 1.0 ডিফল্ট সহ।

TtsClient

মুলতুবি

ক্লায়েন্ট অনুরোধ স্থিতির জন্য সনাক্তকারী.

বৈশিষ্ট্য

  • আইডি

    স্ট্রিং

    ক্লায়েন্ট একটি ভাষা পরিচালনার অনুরোধ করছে। একটি এক্সটেনশনের জন্য, এটি অনন্য এক্সটেনশন আইডি। Chrome বৈশিষ্ট্যগুলির জন্য, এটি বৈশিষ্ট্যটির মানব-পাঠযোগ্য নাম৷

  • উৎস

    অনুরোধকারীর ধরন।

TtsClientSource

মুলতুবি

অনুরোধকারীর ধরন।

এনাম

"ক্রোম বৈশিষ্ট্য"

"এক্সটেনশন"

VoiceGender

Chrome 54+ Chrome 70 থেকে অবরুদ্ধ

লিঙ্গ অবজ্ঞা করা হয়েছে এবং উপেক্ষা করা হবে।

এনাম

"পুরুষ"

"মহিলা"

পদ্ধতি

updateLanguage()

মুলতুবি
chrome.ttsEngine.updateLanguage(
  status: LanguageStatus,
)

একটি ইঞ্জিন দ্বারা কল করা হয় যখন একটি ভাষা ইনস্টল করার চেষ্টা করা হয়, এবং যখন একটি ভাষা আনইনস্টল করা হয়। এছাড়াও একটি ক্লায়েন্ট থেকে একটি স্ট্যাটাস অনুরোধের প্রতিক্রিয়া হিসাবে বলা হয়. যখন একটি ভয়েস ইনস্টল করা হয় বা আনইনস্টল করা হয়, তখন ইঞ্জিনটিকে ভয়েস নিবন্ধন করতে ttsEngine.updateVoices-কে কল করতে হবে।

পরামিতি

updateVoices()

Chrome 66+
chrome.ttsEngine.updateVoices(
  voices: TtsVoice[],
)

কণ্ঠস্বরের তালিকা আপডেট করার জন্য একটি ইঞ্জিন দ্বারা কল করা হয়েছে। এই তালিকাটি এই এক্সটেনশনের ম্যানিফেস্টে ঘোষিত যেকোনো ভয়েসকে ওভাররাইড করে।

পরামিতি

  • ভয়েস

    tts.TtsVoice অবজেক্টের অ্যারে যা বক্তৃতা সংশ্লেষণের জন্য উপলব্ধ ভয়েসকে প্রতিনিধিত্ব করে।

ঘটনা

onInstallLanguageRequest

মুলতুবি
chrome.ttsEngine.onInstallLanguageRequest.addListener(
  callback: function,
)

একটি TTS ক্লায়েন্ট একটি নতুন ভাষা ইনস্টল করার অনুরোধ করলে বরখাস্ত করা হয়। ইঞ্জিনের ভাষাটি ডাউনলোড এবং ইনস্টল করার চেষ্টা করা উচিত এবং ফলাফলের সাথে ttsEngine.updateLanguage এ কল করা উচিত। সফল হলে, নতুন উপলব্ধ ভয়েসগুলি নিবন্ধন করতে ইঞ্জিনের ttsEngine.updateVoices-কেও কল করা উচিত৷

পরামিতি

onPause

chrome.ttsEngine.onPause.addListener(
  callback: function,
)

ঐচ্ছিক: যদি একটি ইঞ্জিন পজ ইভেন্টকে সমর্থন করে, তাহলে এটি একটি সারসংকলন ইভেন্ট বা স্টপ ইভেন্ট না পাওয়া পর্যন্ত বর্তমান উচ্চারণটিকে, যদি থাকে তবে বিরতি দেওয়া উচিত। মনে রাখবেন যে একটি স্টপ ইভেন্টকেও বিরতি দেওয়া অবস্থা সাফ করা উচিত।

পরামিতি

  • কলব্যাক

    ফাংশন

    callback প্যারামিটারটি এর মতো দেখাচ্ছে:

    () => void

onResume

chrome.ttsEngine.onResume.addListener(
  callback: function,
)

ঐচ্ছিক: যদি একটি ইঞ্জিন পজ ইভেন্টকে সমর্থন করে, তবে এটির সারসংকলন ইভেন্টকেও সমর্থন করা উচিত, বর্তমান উচ্চারণটি বলা চালিয়ে যেতে, যদি থাকে। মনে রাখবেন যে একটি স্টপ ইভেন্টকেও বিরতি দেওয়া অবস্থা সাফ করা উচিত।

পরামিতি

  • কলব্যাক

    ফাংশন

    callback প্যারামিটারটি এর মতো দেখাচ্ছে:

    () => void

onSpeak

chrome.ttsEngine.onSpeak.addListener(
  callback: function,
)

যখন ব্যবহারকারী tts.speak() এ কল করে তখন কল করা হয় এবং এই এক্সটেনশনের ম্যানিফেস্টের ভয়েসগুলির মধ্যে একটি হল বিকল্প অবজেক্টের সাথে প্রথম মেলে৷

পরামিতি

  • কলব্যাক

    ফাংশন

    callback প্যারামিটারটি এর মতো দেখাচ্ছে:

    (utterance: string, options: SpeakOptions, sendTtsEvent: function) => void

    • উচ্চারণ

      স্ট্রিং

    • বিকল্প
    • sendTtsEvent

      ফাংশন

      sendTtsEvent প্যারামিটারটি এর মতো দেখাচ্ছে:

      (event: tts.TtsEvent) => void

      • ঘটনা

        টেক্সট-টু-স্পিচ ইঞ্জিন থেকে ইভেন্ট এই উচ্চারণের অবস্থা নির্দেশ করে।

onSpeakWithAudioStream

Chrome 92+
chrome.ttsEngine.onSpeakWithAudioStream.addListener(
  callback: function,
)

যখন ব্যবহারকারী tts.speak() এ কল করে তখন কল করা হয় এবং এই এক্সটেনশনের ম্যানিফেস্টের ভয়েসগুলির মধ্যে একটি হল বিকল্প অবজেক্টের সাথে প্রথম মেলে৷ ttsEngine.onSpeak থেকে আলাদা যে Chrome অডিও প্লেব্যাক পরিষেবা প্রদান করে এবং tts ইভেন্ট পাঠানোর ব্যবস্থা করে।

পরামিতি

  • কলব্যাক

    ফাংশন

    callback প্যারামিটারটি এর মতো দেখাচ্ছে:

    (utterance: string, options: SpeakOptions, audioStreamOptions: AudioStreamOptions, sendTtsAudio: function, sendError: function) => void

    • উচ্চারণ

      স্ট্রিং

    • বিকল্প
    • অডিওস্ট্রিম অপশন
    • TtsAudio পাঠান

      ফাংশন

      sendTtsAudio প্যারামিটারটি এর মতো দেখাচ্ছে:

      (audioBufferParams: AudioBuffer) => void

      • audioBufferParams

        একটি অডিও বাফার এবং সংশ্লিষ্ট ডেটা ধারণকারী পরামিতি।

    • পাঠানোর ত্রুটি

      ফাংশন

      Chrome 94+

      sendError প্যারামিটারটি এর মত দেখাচ্ছে:

      (errorMessage?: string) => void

      • errorMessage

        স্ট্রিং ঐচ্ছিক

        একটি স্ট্রিং ত্রুটি বর্ণনা করে।

onStop

chrome.ttsEngine.onStop.addListener(
  callback: function,
)

tts.stop এ কল করা হলে বরখাস্ত হয় এবং এই এক্সটেনশনটি কথা বলার মাঝখানে হতে পারে। যদি একটি এক্সটেনশন অনস্টপে একটি কল পায় এবং বক্তৃতা ইতিমধ্যেই বন্ধ হয়ে যায়, তবে এটি কিছুই করবে না (একটি ত্রুটি বাড়াবে না)৷ যদি বক্তৃতা থামানো অবস্থায় থাকে, তাহলে এটি থামানো অবস্থা বাতিল করবে।

পরামিতি

  • কলব্যাক

    ফাংশন

    callback প্যারামিটারটি এর মতো দেখাচ্ছে:

    () => void