speak.js: نص إلى كلام على الويب

ويمكن تحويل النص إلى كلام (TTS) جعل محتوى أكثر يسرا، ولكن ليس هناك حتى الآن أي وسيلة بسيطة وعالمية للقيام بذلك على شبكة الإنترنت. ويرد نهج واحد ممكن في هذا العرض ، الذي هو مدعوم من قبل speak.js ، جديدة نقية 100٪ جافا سكريبت / HTML5 تنفيذ تحويل النص إلى كلام. speak.js هو منفذ من eSpeak ، خطاب مفتوح المصدر تركيبي، من C + + إلى جافا سكريبت باستخدام Emscripten .
1 تجميع تركيب الكلام موجود على محرك جافا سكريبت هو وسيلة جيدة لتجنب كتابة مشروع معقد مثل eSpeak من نقطة الصفر. بمجرد تجميعها، رمز eSpeak في speak.js لا يعرف انه يعمل على شبكة الإنترنت: speak.js يستخدم نظام ملفات Emscripten يحتذى به إلى 'وهمية' قراءة ملف عادي، وتدعو إلى أن كتابة eSpeak C + + رمز له (fopen، fread، وما إلى ذلك). وهذا يسمح لاستخدامها العادي eSpeak ملفات البيانات (إما عن طريق xhr، أو عن طريق تحويلها إلى JSON وتجميع لهم مع ملف البرنامج النصي). نتيجة لتشغيل التعليمات البرمجية eSpeak جمعت هو أنه يكتب "ملف WAV. مع الصوت ولدت على نظام الملفات يحتذى. speak.js ثم يأخذ تلك البيانات، وذلك باستخدام ترميز base64، ويخلق URL البيانات. يتم تحميل هذا العنوان ثم في الصوت HTML5 عنصر، مما يتيح للمتصفح التعامل مع التشغيل. (لاحظ أنه في حين أن طريقة بسيطة جدا لفعل الأشياء، ليس هذا هو الأكثر فعالية. speak.js لم تركز حتى الآن على السرعة، ولكن مع بعض الأعمال الإضافية التي يمكن أن تكون أسرع بكثير، إذا تبين أن يكون قضية.)
لماذا تريد تحويل النص إلى كلام في جافا سكريبت؟ حسنا، مع speak.js يمكنك حزمة ملف شبيبة واحد. في موقع الويب الخاص بك، ومن ثم توليد الكلام عن بسيطة مثل كتابة
  يتحدث ("مرحبا العالم") 
(راجع موقع speak.js للحصول على إرشادات). وسوف يكون الخطاب ولدت بالضبط نفس على جميع المنابر، على عكس إذا كان المستخدمون كل فعل تحويل النص إلى كلام بطريقتها الخاصة (باستخدام قدرة نظام التشغيل، أو برنامج منفصل). ويمكن أيضا speak.js أن تستخدم لبناء أدونس المتصفح بطريقة واضحة، لأنه محض جافا سكريبت - لا حاجة لثنائيات تعتمد منصة، والملحق سوف تعمل نفس الشيء في جميع أنظمة تشغيل.
وهناك عدد قليل من التعليقات:
  • جافا سكريبت هو الحصول على أكثر وأكثر قدرة في كل وقت. إصدارات تطوير محركات جافا سكريبت أعلى يمكن اليوم تشغيل التعليمات البرمجية التي تم تجميعها من C + + فقط 3-5X بسرعة أبطأ من مترجم C + +، والحصول على أفضل من ذلك. ونتيجة لذلك، يمكن توسيع قدرات منصة شبكة الإنترنت في كثير من الحالات يمكن القيام به في جافا سكريبت أو عن طريق تجميع لجافا سكريبت، بدلا من إضافة مدونة جديدة للمتصفحات أنفسهم، والتي تأخذ حتما أطول - وخاصة إذا كنت انتظر كل المتصفحات لتنفيذ ميزة خاصة.
  • في حين speak.js يستخدم فقط واجهات برمجة التطبيقات المستندة إلى المعايير، وذلك بسبب القيود المتصفح لا يمكن أن تعمل في كل مكان حتى الآن. فهو لن يعمل في شركة آي إي، وسفاري أو أوبرا لأنها لا تدعم المصفوفات مكتوب، ولا في الكروم نظرا لأنه لا يدعم WAV بيانات عناوين المواقع. هكذا speak.js حاليا يعمل فقط بشكل صحيح في فايرفوكس. ومع ذلك، الميزات في عداد المفقودين التي ذكرت للتو ليست ضخمة، ونأمل تلك صانعي المتصفح سوف تنفيذها قريبا. ومن الممكن أيضا لتنفيذ الحلول في speak.js لهذه القضايا (انظر التعليق التالي).
  • مساعدة في تحسين speak.js أمر مرحب به جدا! شيء واحد مهم نحتاج إليه هو لتنفيذ الحلول للقضايا التي تمنع speak.js من يعمل على المتصفحات أنه حاليا لا يمكن ان تعمل على. وثمة هدف آخر هو بناء أدونس المستعرض باستخدام speak.js. يرجى الاتصال على github إذا كنت تريد مساعدة.
  • eSpeak تدعم عدة لغات بحيث يمكن speak.js أيضا. كنت بحاجة ليشمل ملفات لغة إضافية بالرغم من ذلك. هنا هو بناء التجريبية حيث يمكنك التبديل بين الدعم الانكليزية والفرنسية (لاحظ أن ذلك هو بناء غير محسن، لذلك سوف يعمل بشكل أبطأ).

إرسال تعليق

أحدث أقدم