Skip to content

تشخیص موجودیت

ماژول اصلیتعریف ماژولتوضیحات
NER (Named Entity Recognition)تشخیص موجودیت هاشناسایی موجودیت ها (نام، مکان و...)

فیچرلیست:

ردیفدسته بندیویژگی (Feature)پارامترهای کلیدی / گزینه‌هاداستان کاربر (User Story)
1قابلیت‌های اصلی تشخیصتشخیص موجودیت‌های از پیش‌آموزش‌دیدهentity_types (e.g., PERSON, ORG, LOC)به عنوان یک تحلیل‌گر اخبار، می‌خواهم تمام اسامی افراد، سازمان‌ها و مکان‌های ذکر شده در یک مقاله خبری را به صورت خودکار استخراج کنم.
2پشتیبانی چندزبانهlanguage ('fa', 'en', 'ar')به عنوان یک شرکت بین‌المللی، می‌خواهم بتوانم نام شرکت‌ها و محصولات را هم از متون انگلیسی و هم از متون فارسی با دقت بالا استخراج کنم.
3ارائه امتیاز اطمینان (Confidence Score)include_confidence: trueبه عنوان یک اپراتور، می‌خواهم برای هر موجودیت شناسایی شده یک امتیاز اطمینان ببینم تا مواردی که با دقت پایینی تشخیص داده شده‌اند را برای بازبینی دستی اولویت‌بندی کنم.
4سفارشی‌سازی و آموزش مدلآموزش موجودیت‌های سفارشی (Custom NER)training_data, custom_entity_nameبه عنوان یک شرکت پزشکی، نیاز دارم مدلی را آموزش دهم که بتواند موجودیت‌های خاص ما مانند «نام دارو»، «بیماری» و «علائم بالینی» را در گزارش‌های پزشکی تشخیص دهد.
5ابزار بصری لیبل‌گذاری داده (Annotation Tool)(Web UI for Labeling)به عنوان یک کارشناس دامنه، می‌خواهم بدون نیاز به دانش فنی، بتوانم در یک محیط گرافیکی، کلمات کلیدی در متن را هایلایت و لیبل‌گذاری کنم تا دیتاست آموزشی بسازم.
6تشخیص مبتنی بر دیکشنری و قوانین (Regex)custom_dictionaries, regex_patternsبه عنوان یک شرکت، لیستی از ۱۰۰۰ نام محصول دارم. می‌خواهم سیستم هر جا به این نام‌ها در متن برخورد کرد، آن‌ها را به عنوان موجودیت «محصول» با دقت ۱۰۰٪ شناسایی کند.
7غنی‌سازی و تحلیل پیشرفتهپیونددهی موجودیت (Entity Linking)knowledge_base ('wikipedia', 'custom_kb')به عنوان یک محقق، می‌خواهم وقتی سیستم کلمه «اپل» را پیدا می‌کند، آن را به شناسه منحصربه‌فرد «شرکت اپل» در پایگاه دانش لینک دهد و آن را از «میوه سیب» تمایز دهد.
8استخراج روابط (Relation Extraction)enable_relation_extraction: trueبه عنوان یک تحلیل‌گر مالی، می‌خواهم در متن «شرکت گوگل، یوتیوب را خرید»، سیستم علاوه بر شناسایی موجودیت‌ها، رابطه «خریداری کرد» بین «گوگل» و «یوتیوب» را نیز استخراج کند.
9تحلیل پیشرفته و درک عمیق متنحل وابستگی‌ها و ارجاعات (Coreference Resolution)enable_coreference: trueبه عنوان یک تحلیل‌گر، در متن «کاربر با تیم پشتیبانی تماس گرفت. آن‌ها بسیار کمک‌کننده بودند»، می‌خواهم سیستم بفهمد که «آن‌ها» به «تیم پشتیبانی» ارجاع دارد.
10پشتیبانی از موجودیت‌های تودرتو (Nested Entities)nested_entities: trueبه عنوان یک تحلیل‌گر اسناد حقوقی، در عبارت «شعبه مرکزی بانک ملی ایران در تهران»، می‌خواهم سیستم «بانک ملی ایران» (سازمان) و «تهران» (مکان) را به عنوان دو موجودیت مجزا تشخیص دهد.
11تحلیل احساسات مبتنی بر موجودیت (Aspect-Based Sentiment)enable_aspect_sentiment: trueبه عنوان یک مدیر محصول، در جمله «دوربین این گوشی عالی است اما باتری آن ضعیف است»، می‌خواهم بدانم که احساسات نسبت به «دوربین» مثبت و نسبت به «باتری» منفی است.
12پس‌پردازش و کاربردهاحذف و پوشاندن اطلاعات حساس (PII Redaction)redaction_policy ('mask', 'replace')به عنوان یک مدیر پشتیبانی، می‌خواهم قبل از تحلیل متن تیکت‌ها، تمام نام‌ها، ایمیل‌ها و شماره‌های تلفن را به صورت خودکار حذف کنم تا حریم خصوصی حفظ شود.
13عادی‌سازی موجودیت‌ها (Normalization)normalization_rulesبه عنوان یک تحلیل‌گر داده، می‌خواهم مقادیر پولی مختلف مانند "دو میلیون تومان" و "۲,۰۰۰,۰۰۰ تومان" به صورت یکسان و نرمال‌شده (مثلاً 2000000) استخراج شوند.
14پلتفرم، API و عملیاتAPI جامع و کتابخانه‌های توسعه (SDKs)API_keys, SDKs (Python, JS)به عنوان یک توسعه‌دهنده، می‌خواهم با استفاده از یک کتابخانه آماده پایتون، به راحتی قابلیت استخراج موجودیت‌ها را به خط لوله پردازش داده خود اضافه کنم.
15پردازش دسته‌ای و غیرهمزمان (Batch & Async)batch_id, input_file_url, webhook_urlبه عنوان یک شرکت حقوقی، نیاز دارم آرشیو کامل ۱۰ هزار سند خود را به صورت یکجا برای استخراج موجودیت‌ها ارسال کنم و پس از اتمام پردازش، نتیجه را دریافت نمایم.
16داشبورد تحلیل و مصرف(Admin Dashboard UI)به عنوان مدیر محصول، می‌خواهم در یک داشبورد ببینم که کاربران ما بیشتر کدام نوع از موجودیت‌ها را استخراج می‌کنند و میزان مصرف API در ماه چقدر بوده است.
17مدیریت مدل در مقیاس سازمانیاستودیوی مدیریت و نسخه‌بندی مدل‌های سفارشی(Model Management Dashboard)به عنوان مدیر تیم هوش مصنوعی، به یک داشبورد مرکزی نیاز دارم تا بتوانم ۲۰ مدل NER سفارشی که برای واحدهای مختلف ساخته‌ایم را مدیریت، نسخه‌بندی و عملکردشان را پایش کنم.
18کاربردهای تخصصی و بهینهارائه مدل‌های سبک و بهینه برای موبایل/لبه (Edge)model_size ('standard', 'lightweight')به عنوان یک توسعه‌دهنده اپلیکیشن موبایل، به یک مدل NER آفلاین نیاز دارم که بتواند مستقیماً روی گوشی کاربر اجرا شود تا اطلاعات تماس را از متن استخراج کند.