Appearance
تشخیص موجودیت
| ماژول اصلی | تعریف ماژول | توضیحات |
|---|---|---|
| NER (Named Entity Recognition) | تشخیص موجودیت ها | شناسایی موجودیت ها (نام، مکان و...) |
فیچرلیست:
| ردیف | دسته بندی | ویژگی (Feature) | پارامترهای کلیدی / گزینهها | داستان کاربر (User Story) |
|---|---|---|---|---|
| 1 | قابلیتهای اصلی تشخیص | تشخیص موجودیتهای از پیشآموزشدیده | entity_types (e.g., PERSON, ORG, LOC) | به عنوان یک تحلیلگر اخبار، میخواهم تمام اسامی افراد، سازمانها و مکانهای ذکر شده در یک مقاله خبری را به صورت خودکار استخراج کنم. |
| 2 | پشتیبانی چندزبانه | language ('fa', 'en', 'ar') | به عنوان یک شرکت بینالمللی، میخواهم بتوانم نام شرکتها و محصولات را هم از متون انگلیسی و هم از متون فارسی با دقت بالا استخراج کنم. | |
| 3 | ارائه امتیاز اطمینان (Confidence Score) | include_confidence: true | به عنوان یک اپراتور، میخواهم برای هر موجودیت شناسایی شده یک امتیاز اطمینان ببینم تا مواردی که با دقت پایینی تشخیص داده شدهاند را برای بازبینی دستی اولویتبندی کنم. | |
| 4 | سفارشیسازی و آموزش مدل | آموزش موجودیتهای سفارشی (Custom NER) | training_data, custom_entity_name | به عنوان یک شرکت پزشکی، نیاز دارم مدلی را آموزش دهم که بتواند موجودیتهای خاص ما مانند «نام دارو»، «بیماری» و «علائم بالینی» را در گزارشهای پزشکی تشخیص دهد. |
| 5 | ابزار بصری لیبلگذاری داده (Annotation Tool) | (Web UI for Labeling) | به عنوان یک کارشناس دامنه، میخواهم بدون نیاز به دانش فنی، بتوانم در یک محیط گرافیکی، کلمات کلیدی در متن را هایلایت و لیبلگذاری کنم تا دیتاست آموزشی بسازم. | |
| 6 | تشخیص مبتنی بر دیکشنری و قوانین (Regex) | custom_dictionaries, regex_patterns | به عنوان یک شرکت، لیستی از ۱۰۰۰ نام محصول دارم. میخواهم سیستم هر جا به این نامها در متن برخورد کرد، آنها را به عنوان موجودیت «محصول» با دقت ۱۰۰٪ شناسایی کند. | |
| 7 | غنیسازی و تحلیل پیشرفته | پیونددهی موجودیت (Entity Linking) | knowledge_base ('wikipedia', 'custom_kb') | به عنوان یک محقق، میخواهم وقتی سیستم کلمه «اپل» را پیدا میکند، آن را به شناسه منحصربهفرد «شرکت اپل» در پایگاه دانش لینک دهد و آن را از «میوه سیب» تمایز دهد. |
| 8 | استخراج روابط (Relation Extraction) | enable_relation_extraction: true | به عنوان یک تحلیلگر مالی، میخواهم در متن «شرکت گوگل، یوتیوب را خرید»، سیستم علاوه بر شناسایی موجودیتها، رابطه «خریداری کرد» بین «گوگل» و «یوتیوب» را نیز استخراج کند. | |
| 9 | تحلیل پیشرفته و درک عمیق متن | حل وابستگیها و ارجاعات (Coreference Resolution) | enable_coreference: true | به عنوان یک تحلیلگر، در متن «کاربر با تیم پشتیبانی تماس گرفت. آنها بسیار کمککننده بودند»، میخواهم سیستم بفهمد که «آنها» به «تیم پشتیبانی» ارجاع دارد. |
| 10 | پشتیبانی از موجودیتهای تودرتو (Nested Entities) | nested_entities: true | به عنوان یک تحلیلگر اسناد حقوقی، در عبارت «شعبه مرکزی بانک ملی ایران در تهران»، میخواهم سیستم «بانک ملی ایران» (سازمان) و «تهران» (مکان) را به عنوان دو موجودیت مجزا تشخیص دهد. | |
| 11 | تحلیل احساسات مبتنی بر موجودیت (Aspect-Based Sentiment) | enable_aspect_sentiment: true | به عنوان یک مدیر محصول، در جمله «دوربین این گوشی عالی است اما باتری آن ضعیف است»، میخواهم بدانم که احساسات نسبت به «دوربین» مثبت و نسبت به «باتری» منفی است. | |
| 12 | پسپردازش و کاربردها | حذف و پوشاندن اطلاعات حساس (PII Redaction) | redaction_policy ('mask', 'replace') | به عنوان یک مدیر پشتیبانی، میخواهم قبل از تحلیل متن تیکتها، تمام نامها، ایمیلها و شمارههای تلفن را به صورت خودکار حذف کنم تا حریم خصوصی حفظ شود. |
| 13 | عادیسازی موجودیتها (Normalization) | normalization_rules | به عنوان یک تحلیلگر داده، میخواهم مقادیر پولی مختلف مانند "دو میلیون تومان" و "۲,۰۰۰,۰۰۰ تومان" به صورت یکسان و نرمالشده (مثلاً 2000000) استخراج شوند. | |
| 14 | پلتفرم، API و عملیات | API جامع و کتابخانههای توسعه (SDKs) | API_keys, SDKs (Python, JS) | به عنوان یک توسعهدهنده، میخواهم با استفاده از یک کتابخانه آماده پایتون، به راحتی قابلیت استخراج موجودیتها را به خط لوله پردازش داده خود اضافه کنم. |
| 15 | پردازش دستهای و غیرهمزمان (Batch & Async) | batch_id, input_file_url, webhook_url | به عنوان یک شرکت حقوقی، نیاز دارم آرشیو کامل ۱۰ هزار سند خود را به صورت یکجا برای استخراج موجودیتها ارسال کنم و پس از اتمام پردازش، نتیجه را دریافت نمایم. | |
| 16 | داشبورد تحلیل و مصرف | (Admin Dashboard UI) | به عنوان مدیر محصول، میخواهم در یک داشبورد ببینم که کاربران ما بیشتر کدام نوع از موجودیتها را استخراج میکنند و میزان مصرف API در ماه چقدر بوده است. | |
| 17 | مدیریت مدل در مقیاس سازمانی | استودیوی مدیریت و نسخهبندی مدلهای سفارشی | (Model Management Dashboard) | به عنوان مدیر تیم هوش مصنوعی، به یک داشبورد مرکزی نیاز دارم تا بتوانم ۲۰ مدل NER سفارشی که برای واحدهای مختلف ساختهایم را مدیریت، نسخهبندی و عملکردشان را پایش کنم. |
| 18 | کاربردهای تخصصی و بهینه | ارائه مدلهای سبک و بهینه برای موبایل/لبه (Edge) | model_size ('standard', 'lightweight') | به عنوان یک توسعهدهنده اپلیکیشن موبایل، به یک مدل NER آفلاین نیاز دارم که بتواند مستقیماً روی گوشی کاربر اجرا شود تا اطلاعات تماس را از متن استخراج کند. |