Appearance
تبدیل متن به صدا
| ماژول اصلی | تعریف ماژول | توضیحات |
|---|---|---|
| Text to speech (TTS) | تبدیل متن به صدا | خواندن متون به صورت صدای انسانی |
فیچرلیست:
| ردیف | دسته بندی | ویژگی (Feature) | پارامترهای کلیدی / گزینهها | داستان کاربر (User Story) |
|---|---|---|---|---|
| 1 | کیفیت و تنوع صدا | صداهای عصبی با کیفیت بالا (Neural Voices) | voice_id, model_type (e.g., neural, HD) | به عنوان کاربر یک اپلیکیشن کتاب صوتی، میخواهم صدای گوینده کاملاً طبیعی و دلنشین باشد تا از شنیدن داستان لذت ببرم. |
| 2 | کتابخانه گسترده صدا، زبان و لهجهها | language_code ('en-US', 'en-GB', 'fa-IR'), voice_name | به عنوان یک شرکت آموزش ایرانی، میخواهم محتوای آموزشی خود را یک بار با گویش لری و بار دیگر با گویش ترکی تولید کنم. | |
| 3 | کنترل و ابرازگری صدا | پشتیبانی کامل از SSML | تگهای SSML در متن ورودی (e.g., <prosody>, <break>) | به عنوان یک تولیدکننده محتوا، میخواهم بتوانم قبل از یک نکته کلیدی، یک مکث کوتاه ایجاد کنم و یک کلمه خاص را با تأکید بیشتری تلفظ نمایم. |
| 4 | انتخاب سبک صحبت و احساسات | speaking_style ('newscaster', 'chatbot'), emotion ('cheerful') | به عنوان توسعهدهنده یک اپلیکیشن داستانگویی برای کودکان، میخواهم صدای راوی بتواند لحنی شاد، هیجانزده یا آرام به خود بگیرد. | |
| 5 | سفارشیسازی و امنیت برند | شبیهسازی صدای سفارشی (Custom Voice Cloning) | audio_samples, custom_voice_name, consent_statement | به عنوان یک شرکت، میخواهم از صدای آشنای مدیرعامل برای پیامهای رسمی استفاده کنم، بدون اینکه نیاز باشد ایشان هر بار برای ضبط به استودیو بیایند. |
| 6 | واژهنامه تلفظ سفارشی (Custom Lexicon) | lexicon_id, pronunciation_rules (e.g., IPA, X-SAMPA) | به عنوان یک شرکت نرمافزاری، میخواهم مطمئن شوم که نام محصول ما "CodeGenius" به درستی تلفظ میشود و با کلمات دیگر اشتباه گرفته نمیشود. | |
| 7 | استودیوی مدیریت صداهای سفارشی | (Admin Dashboard UI) | به عنوان مدیر برند، میخواهم یک پنل مرکزی برای مدیریت صداهای رسمی شرکت و کنترل دسترسی تیمهای مختلف به آنها داشته باشم. | |
| 8 | کنترل محتوای مجاز برای صداهای سفارشی | gated_content_mode (true/false), approved_scripts_library | به عنوان مدیر ارتباطات، میخواهم اطمینان حاصل کنم که از صدای شبیهسازی شده مدیرعامل فقط برای خواندن بیانیههای مطبوعاتی تایید شده استفاده میشود. | |
| 9 | خروجی و یکپارچهسازی | API استریمینگ بیدرنگ (Real-time Streaming) | WebSocket/gRPC API endpoints | به عنوان توسعهدهنده یک دستیار صوتی، میخواهم پاسخها به محض تولید، به صورت جریانی برای کاربر پخش شوند و نیازی به انتظار برای تکمیل کل فایل صوتی نباشد. |
| 10 | خروجی فراداده (Speech Marks / Timestamps) | enable_speech_marks=true | به عنوان توسعهدهنده یک اپلیکیشن آموزش زبان، میخواهم همزمان با پخش صوتی یک کلمه، همان کلمه در متن روی صفحه هایلایت شود. | |
| 11 | پشتیبانی از فرمتها و کیفیتهای مختلف خروجی | output_format (MP3, WAV), sample_rate, bitrate | به عنوان یک پادکستر، میخواهم خروجی نهایی را با بالاترین کیفیت ممکن در فرمت WAV دریافت کنم تا بتوانم آن را در نرمافزار تدوین صدا ویرایش کنم. | |
| 12 | اعمال افکتهای صوتی و موسیقی پسزمینه | audio_effects (reverb), background_music_url, mix_level | به عنوان سازنده یک ویدیوی تبلیغاتی، میخواهم صدای گوینده با یک موسیقی پسزمینه ملایم ترکیب شود تا ویدیوی جذابتری داشته باشم. | |
| 13 | API تولید غیرهمزمان (Asynchronous Synthesis API) | input_text_url, output_storage_url, webhook_notification_url | به عنوان یک ناشر کتاب، میخواهم یک کتاب ۳۰۰ صفحهای را برای تبدیل به کتاب صوتی ارسال کنم و پس از اتمام فرآیند، از طریق یک نوتیفیکیشن مطلع شوم. | |
| 14 | پلتفرم و ابزارهای توسعهدهنده | کتابخانههای توسعه نرمافزار (SDKs) | pip install tts-sdk, npm install tts-sdk | به عنوان یک برنامهنویس پایتون، میخواهم با استفاده از یک کتابخانه آماده و تنها با چند خط کد، قابلیت تبدیل متن به صدا را به اپلیکیشن خود اضافه کنم. |
| 15 | داشبورد تحلیل و مصرف | usage_dashboard, billing_portal | به عنوان مدیر محصول، میخواهم بدانم کاربران ما ماهانه چند میلیون کاراکتر را به صدا تبدیل میکنند تا بتوانم هزینهها را مدیریت و پیشبینی کنم. | |
| 16 | گزینههای استقرار (On-premise / Private Cloud) | (Deployment Package) | به عنوان مدیر IT یک بانک، به دلیل الزامات امنیتی، نمیتوانم دادههای مشتریان را به ابر عمومی ارسال کنم و نیاز دارم موتور TTS را روی سرورهای داخلی خودمان اجرا کنم. | |
| 17 | زمین بازی تعاملی (Interactive Playground) | (Web UI) | به عنوان یک مشتری بالقوه، میخواهم قبل از خرید سرویس، بتوانم صدای گویندههای مختلف را با متن دلخواه خودم تست کنم و کیفیت آنها را بسنجم. |