Appearance
تشخیص مشابهت
| ماژول اصلی | تعریف ماژول | توضیحات |
|---|---|---|
| Similarity Detection | تشخیص مشابهت | مقایسه و یافتن شباهت |
فیچرلیست:
| ردیف | دسته بندی | ویژگی (Feature) | پارامترهای کلیدی / گزینهها | داستان کاربر (User Story) |
|---|---|---|---|---|
| 1 | قابلیتهای اصلی تشخیص شباهت | مشابهت معنایی متن (Semantic Text Similarity) | text_1, text_2, corpus_of_texts | به عنوان یک معلم، میخواهم مقاله یک دانشجو را با مجموعهای از مقالات آنلاین مقایسه کنم تا از عدم وجود سرقت ادبی (Plagiarism) مطمئن شوم. |
| 2 | مشابهت بصری تصویر (Visual Image Similarity) | image_1, image_2, corpus_of_images | به عنوان یک خریدار در یک سایت فروشگاهی، میخواهم با آپلود کردن عکس یک لباس، تمام لباسهای با طرح و استایل مشابه را پیدا کنم. | |
| 3 | تشخیص اسناد تکراری (Duplicate Document Detection) | document_1, document_2 | به عنوان مدیر یک سیستم بایگانی، میخواهم قبل از ورود یک سند جدید، بررسی کنم که آیا نسخهای کاملاً مشابه یا بسیار نزدیک به آن از قبل در سیستم وجود دارد یا خیر. | |
| 4 | پشتیبانی از دادههای پیچیده | مشابهت صوتی (Audio Similarity) | audio_1, audio_2, audio_corpus | به عنوان یک مدیر پلتفرم موسیقی، میخواهم کاربران بتوانند یک آهنگ را انتخاب کنند و سیستم به صورت خودکار آهنگهایی با حال و هوا و ریتم مشابه را به آنها پیشنهاد دهد. |
| 5 | مشابهت بر روی اشیاء ترکیبی (Composite Objects) | object_schema, feature_weights | به عنوان یک تحلیلگر کشف تقلب، میخواهم پروفایلهای کاربری مشابه یک کاربر متقلب را پیدا کنم؛ این مشابهت باید بر اساس ترکیبی از اطلاعات ثبتنام و الگوهای تراکنش باشد. | |
| 6 | تشخیص الگوی مشابه در دادههای سری زمانی | time_series_data, pattern_window | به عنوان یک تحلیلگر بازار سهام، میخواهم نمودارهای تاریخی سهامی را پیدا کنم که الگوی قیمتی مشابهی با الگوی امروز یک سهم خاص از خود نشان دادهاند. | |
| 7 | کنترل و سفارشیسازی | تنظیم آستانه شباهت (Similarity Threshold) | similarity_threshold (e.g., 0.95), top_k | به عنوان یک توسعهدهنده، میخواهم در نتایج جستجوی خود، فقط آیتمهایی را ببینم که امتیاز شباهت آنها بالاتر از ۹۵٪ است. |
| 8 | فاینتیونینگ مدل برای دامنه خاص | training_data | به عنوان یک شرکت حقوقی، نیاز دارم مدل را طوری آموزش دهم که بفهمد دو بند قرارداد میتوانند از نظر مفهومی مشابه باشند، حتی اگر از کلمات کاملاً متفاوتی استفاده کرده باشند. | |
| 9 | انتخاب معیار سنجش شباهت | metric ('cosine', 'euclidean') | به عنوان یک دانشمند داده، میخواهم برای فضای برداری خاص خودم، بتوانم بهترین معیار فاصله (مانند شباهت کسینوسی) را برای مقایسه انتخاب کنم. | |
| 10 | کاربردهای پیشرفته | خوشهبندی آیتمهای مشابه (Clustering) | corpus_of_items, num_clusters | به عنوان مدیر پشتیبانی، میخواهم ۱۰۰۰ تیکت ورودی جدید را به صورت خودکار به خوشههایی از مشکلات مشابه (مانند "مشکل درگاه پرداخت") تقسیمبندی کنم. |
| 11 | کشف ناهنجاری (Anomaly/Outlier Detection) | corpus_of_items, anomaly_sensitivity | به عنوان یک تحلیلگر تقلب مالی، میخواهم مجموعهای از تراکنشها را تحلیل کرده و تراکنشهایی را که الگوی آنها با بقیه بسیار متفاوت است، شناسایی کنم. | |
| 12 | جستجوی چندوجهی (Cross-Modal Search) | input_type ('text-to-image') | به عنوان کاربر یک سایت عکس، میخواهم بتوانم عبارت «قایق در حال حرکت روی دریاچه آرام» را تایپ کرده و تصاویری را که با این توصیف مطابقت دارند، پیدا کنم. | |
| 13 | پیشنهاد تگهای مشابه (Related Tag Suggestions) | source_tag, top_k | به عنوان یک مدیر محتوا، وقتی مقالهای را با تگ «هوش مصنوعی» نشانهگذاری میکنم، میخواهم سیستم به صورت خودکار تگهای مشابه معنایی مانند «یادگیری ماشین» را پیشنهاد دهد. | |
| 14 | جستجوی پیشرفته و عملکرد | جستجوی ترکیبی (Hybrid Search: Vector + Metadata) | vector_query, metadata_filters | به عنوان یک خریدار، میخواهم پس از جستجوی بصری یک کفش ورزشی، بتوانم نتایج مشابه را بر اساس «برند» و «قیمت» فیلتر کنم تا به محصول مورد نظرم برسم. |
| 15 | مدیریت ایندکسهای جستجوی برداری (ANN Index) | (Admin Dashboard UI for index management) | به عنوان یک مهندس DevOps که یک کاتالوگ با ۱۰ میلیون محصول را مدیریت میکند، به یک داشبورد برای نظارت بر سلامت و سرعت ایندکس جستجو نیاز دارم. | |
| 16 | هوشمندی و یادگیری پیشرفته | قابلیت توضیح شباهت (Explainable AI - XAI) | enable_explanation: true | به عنوان یک مدیر فروشگاه، میخواهم وقتی سیستم دو محصول را مشابه تشخیص میدهد، به من نشان دهد که این شباهت بر اساس کدام ویژگیهای بصری بوده است. |
| 17 | رتبهبندی خود-بهبودیابنده (Self-tuning Ranks) | learning_from_clicks (true/false) | به عنوان یک مدیر محصول، میخواهم سیستم از رفتار کاربران یاد بگیرد؛ اگر کاربران بیشتر روی نتیجه پنجم کلیک میکنند، سیستم به مرور زمان آن نتیجه را در رتبههای بالاتر نمایش دهد. | |
| 18 | بصریسازی و کاوش در فضای برداری (Vector Space Exploration) | (Interactive 3D/2D UI) | به عنوان یک دانشمند داده، میخواهم یک نقشه تعاملی از تمام Embeddingهای محصولاتم داشته باشم تا به صورت بصری ببینم دستهبندیهای مختلف چگونه در کنار هم قرار گرفتهاند. | |
| 19 | گردش کار یادگیری فعال (Active Learning Workflow) | feedback_loop_mode: 'active' | به عنوان یک مهندس یادگیری ماشین، میخواهم برای فاینتیون کردن مدل، سیستم به صورت هوشمند جفت آیتمهایی که بیشترین ابهام را دارد به من نشان دهد تا با لیبلگذاری، مدل را بهبود دهم. | |
| 20 | پایش و اطلاعرسانی پویا | پرسوجوهای پایدار و هشدارهای بیدرنگ (Persistent Queries) | save_query: true, alert_threshold | به عنوان یک علاقهمند به مد، میخواهم پس از جستجوی یک مدل کیف کمیاب، آن جستجو را "ذخیره" کنم و به محض اینکه آیتم مشابهی موجود شد، نوتیفیکیشن دریافت نمایم. |
| 21 | پلتفرم، API و عملیات | یکپارچهسازی با پایگاه داده برداری (Vector DB) | vector_db_connection, index_name | به عنوان یک توسعهدهنده، میخواهم از این موتور تشخیص مشابهت بر روی دیتابیس برداری موجود خودم که حاوی Embeddingهای محصولاتم است، استفاده کنم. |
| 22 | API جامع و کتابخانههای توسعه (SDKs) | API_keys, SDKs | به عنوان یک برنامهنویس، میخواهم با استفاده از یک SDK ساده، قابلیت جستجوی معنایی را به بخش سوالات متداول وبسایت خود اضافه کنم. | |
| 23 | پردازش دستهای و غیرهمزمان (Batch & Async) | batch_file_url, webhook_url | به عنوان مدیر یک آرشیو بزرگ، نیاز دارم تمام ۵ میلیون تصویر موجود در آرشیو را برای یافتن موارد تکراری یا بسیار مشابه، به صورت یکجا پردازش کنم. | |
| 24 | داشبورد تحلیل و مصرف | (Admin Dashboard UI) | به عنوان مدیر محصول، میخواهم گزارشی از پرتکرارترین جستجوها و میانگین امتیاز شباهت نتایج را مشاهده کنم تا از عملکرد سیستم مطلع شوم. |