metadata
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- dense
- generated_from_trainer
- dataset_size:3390
- loss:MultipleNegativesRankingLoss
base_model: sentence-transformers/paraphrase-multilingual-mpnet-base-v2
widget:
- source_sentence: دیبجا گیلان
sentences:
- >-
عنوان: کلانه ترهفرنگی برای نهار | استان: کردستان | برچسبها: سرخکردنی
| مواد: ترهفرنگی، خمیر، نمک، روغن | مراحل: ۱ خمیر همه کاری و فوری خمیر
فوری همهکاره ۲ ۳ ۴ دوستان ترهفرنگی روخرد کنید بشورید بذارید آبش بکشه
بعد بهش نمک بزنید ۵ ۶ بعد خمیرتون روپهن کنید بعدش کمی ترهفرنگی بریزید
داخلش بعدش خمیر رو تا کنید و بیندازید توی روغن و هر دو طرف رو سرخ کنید
- >-
عنوان: دیبجا | استان: گیلان | برچسبها: دریایی | مواد: دل و روده ماهی
سفید، برگ سیر خردشده، انار ترش، نمک و فلفل و زردچوبه، روغن | مراحل:
ابتدا دل و روده ماهی را خوب شسته و تمیز میکنیم و در تابه ریخته روی
حرارت گذاشته و مرتب هم میزنیم تا آب اضافه آن تبخیر شود. پیازها راخرد
کرده و در تابه دیگری پیازها را با روغن تف داده، و قتی طلایی شد برگ سیر
را هم اضافه میکنیم تاکمی تف خورده و نرم شود. روده ماهی را به پیاز داغ و
برگ سیر، به همراه نمک و فلفل و زردچوبه اضافه کرده و باهم تف
- >-
عنوان: آش کشک چهارمحال و بختیاری | استان: چهارمحال و بختیاری | برچسبها:
آش/سوپ، برنجی، حبوباتمحور، سرخکردنی | مواد: روغن مایع، فلفل سیاه، سبزی
آش، آب، کشک، نخود، برنج، زردچوبه، نعنا خشک، لوبیا سفید، نمک | مراحل: •
برنج، نخود و لوبیا سفید را پاک کنید و بشویید. • سبزی را پاک کرده، بشویید
و خرد کنید. • پیاز را بشویید، پوست بگیرید و نگینی خرد کنید. نخود و لوبیا
سفید را با مقداری آب در ظروف جداگانه بپزید و آبکشی کنید. برنج را هم با
مقداری آب در قابلمه مدنظر برای پخت آش بپزید؛ ا
- source_sentence: آبگوشت سفید (آبگوشت ساوه)
sentences:
- >-
عنوان: قتلمه | استان: مازندران | برچسبها: دریایی، سرخکردنی | مواد:
شیر، ارد، پیازچه، نمک، تخممرغ، خمیرمایه، شکر | مراحل: ابتدا شیر را گرم
میکنیم و لی داغ نباشد. خمیرمایه و شکر را اضافه میکنیم ده دقیقه
میماند. در ظرفی تخممرغ را میزنیم و هم میزنیم، نمک میزنیم. شیر و
مایهخمیر را اضافه میکنیم. ارد را الک کرده و کمکم اضافه میکنیم تا
حالت خمیر کیک را بگیرد. پیازچه خرد شده را اضافه میکنیم. بعد از یک ساعت
استراحت به مایه در ظرف مناسب سرخ میکنیم. بهتر است با ملاقه از م
- >-
عنوان: نان کماج تبریز | استان: آذربایجان شرقی | برچسبها: دریایی،
فرپز/تنوری، نانی/آردی | مواد: آرد فانتزی، تخممرغ، آب، شیر، شکر، روغن
مایع، خمیر مایه فوری، بهبود دهنده، نمک، خامه صبحانه، عسل، زرده تخممرغ،
خامه، کنجد مقداری | مراحل: ابتدا خمیر مایه اگر فوری نبود را لا ۱ قاشق
شکر و کمی آب میگذاریم تا عمل بیاد. آرد را داخل یک ظرف گود میریزیم و
همه مواد غیر از آب را به آرد اضافه میکنیم. با دست خمیر را جمع میکنیم،
آب را کمکم اضافه میکنیم تا جایی که یک خمیر نرم و نه شل بدس
- >-
عنوان: آبگوشت سفید (آبگوشت ساوه) | استان: مرکزی | برچسبها: سرخکردنی |
مواد: گوشت آبگوشتی گوسفند، دنبه، سیبزمینی، زردچوبه | مراحل: من چون
میخواستم چربی این غذا رو در پخت و پزهای بعدی استفاده کنم مقدار دنبه
زیادی رو گذاشتم پخت و بعد برداشتم کنار گذاشتم. گوشت و آب رو با هم جوش
دادم و قتی کف کرد آب رو دور ریختم و گدشت رو شستم. بعد پیاز را خرد
میکنیم. گوشت و پیاز خام را میذاریم تا حسابی بپزه یه تکه از دنبهام
میریزیم بقیشو کنار میذاریم. (من داخل زودپز دستساز پختم.) سیبزمینی
- source_sentence: حلوا انگشت پیچ بوشهری بوشهر
sentences:
- >-
عنوان: حلوا انگشت پیچ بوشهری | استان: بوشهر | برچسبها: دسر/شیرینی |
مواد: آرد سفید قنادی، آرد گندم، شکر، آب جوش، گلاب، روغن | مراحل: برای
درست کردن حلوا انگشت پیچ بوشهری ابتدا باید شکر را داخل یک ظرف ریخته و به
آن آب جوش اضافه کنید. بعد از این مرحله باید شکر به طور کامل در آب حل
شود. در همین حین تا زمانیکه شکر در آب حل شود گلاب را اضافه میکنیم و
کنار میگذاریم. داخل یک قابلمه آردها را به خوبی و با صبر و حوصله زیاد
الک میکنیم. سپس مقداری روغن اضافه میکنیم تا مخلوط همانند
- >-
عنوان: آش لخشک | استان: خراسان رضوی | برچسبها: آش/سوپ، برنجی،
حبوباتمحور | مواد: مرغ، لپه، برنج، ماست، پیاز، نعنا، زعفران | مراحل:
مرغ، لپه، و برنج را آماده کنید. اش را بپزید. اش را با ماست ترکیب کنید.
ماست را سریع هم بزنید. اش را در ظرف سرو کنید. رویاش را با پیاز داغ،
نعنا داغ و زعفران تزئین کنید.
- >-
عنوان: خورش تره کوهی ایلام | استان: ایلام | برچسبها: حبوباتمحور، خورش،
سرخکردنی | مواد: گوشت گوسفندی یا گوساله، تره ساطوری شده، لوبیا سفید یا
لوبیا قرمز، لیمو، نمک، زردچوبه، فلفل قرمز، روغن، زعفران دمکرده،
سیبزمینی، گوجهفرنگی | مراحل: لوبیا را از شب قبل خیس کنید و چند بار آب
آن را عوض کنید. در قابلمه روغن بریزید و پیاز خرد شده را تفت دهید تا سبک
و شیشهای شود. گوشت خرد شده را اضافه کنید و برای ۵ دقیقه سرخ کنید. لوبیا
را به همراه زردچوبه در قابلمه بریزید و برای ۲ دقیقه دیگر
- source_sentence: شله ارده خوزستان
sentences:
- >-
عنوان: کباب کوبیده سنتی قمی | استان: قم | برچسبها: کباب/گریل | مواد:
گوشت گوساله، قلوهگاه گوسفندی، زعفران دمکرده، نمک، فلفل، زردچوبه، رنده
ریز شده | مراحل: همه مواد را جداگانه آماده کنید. گوشت را یکبار بچرخاند.
گوشت را دوباره با چرخگوشت ایرانی پارس خزر بچرخاند. گوشت را تا حدی که
سفید شود، خوب تفت دهید. تمام مواد را روی گوشت بریزید. نیم ساعت مواد را
به خوبی ماساژ دهید. گوشت را به شکل دوکی برش دهید. دستگاه سیخکوب را روی
میز قرار دهید. دوک گوشت را خیس کنید. نایلون فریزر را
- >-
عنوان: شله ارده | استان: خوزستان | برچسبها: برنجی، حبوباتمحور، سریع |
مواد: ماش، برنج نیمدانه، برگ چغندر، چغندر، ارده، نمک | مراحل: برگ چغندر
را ریز خرد کنید و همراه با چغندرهایی که درشت خرد کردهاید و سه لیتر آب در
قابلمه بریزید. ماش و برنج را به این مواد اضافه کنید و اجازه دهید که با
هم بپزند. در آخر به غذا نمک بزنید. بعد از پخت کامل، زیر قابلمه را خاموش
کنید و ارده را در آن بریزید
- >-
عنوان: آش لعابی | استان: اصفهان | برچسبها: آش/سوپ، حبوباتمحور،
سرخکردنی | مواد: زردچوبه، بلغور گندم، آب، نمک، فلفل سیاه، روغن مایع،
لوبیا سفید | مراحل: گوشت را تمیز بشویید تا مو و خرده استخوانی به آن
نماند. لوبیا را پاک کنید و بشویید. پیازها را بشویید و پوست بگیرید، سپس
نصفشان را کامل نگه دارید و نصف دیگر را خلالی یا نگینی خرد کنید. گوشت،
لوبیا سفید و پیاز درسته را با مقداری آب بار بگذارید. میتوانید به روش
پخت گوشت مراجعه کنید تا گوشت و آبگوشت خوش طعمتری داشته باشید. در
- source_sentence: آش تمر هندی یزد
sentences:
- >-
عنوان: دنی و دیمه دنی | استان: خراسان شمالی | برچسبها: حبوباتمحور |
مواد: گندم کامل، گندم نیم کوب پوستکنده، لوبیا، عدس، نخود، آب، پیاز داغ
| مراحل: انتخاب نوع گندم (گندم کامل یا گندم نیم کوب پوستکنده) خیساندن
حبوبات (لوبیا، عدس، نخود) در آب قلم پخت حبوبات با آب قلم به آرامی تا
غلظت حلیم اضافه کردن پیاز داغ (در صورت تمایل)
- >-
عنوان: آش تمر هندی | استان: یزد | برچسبها: آش/سوپ، برنجی، حبوباتمحور |
مواد: تمر هندی، نخود، لوبیا، عدس، گوشت گوسفندی، برنج، پیاز، نعنا |
مراحل: تهیه مواد اولیه تمر هندی، نخود، لوبیا، عدس، گوشت گوسفندی، برنج و
پیاز پختن گوشت گوسفندی پختن حبوبات (نخود، لوبیا، عدس) اضافه کردن برنج به
گوشت و حبوبات اضافه کردن تمر هندی به مواد اضافه کردن پیاز تکمیل با نعنا
- >-
عنوان: قروت بیرجندی | استان: خراسان جنوبی | مواد: کشک، آب، گردو، پیاز
داغ، نعنا داغ، نمک، فلفل سیاه، دارچین، روغن | مراحل: کشک را با کمی آب
مخلوط کنید تا به شکل مایع دربیاید. گردو را تا حدی بکوبید تا روغن پس دهد
و به کشک اضافه کنید. پیاز داغ و نعنا داغ را به اندازه دلخواه آماده کنید.
مواد آمادهشده را با هم مخلوط کنید و در قابلمه بجوشانید. مواد را با
حرارت ملایم بجوشانید تا غل نزنند.
pipeline_tag: sentence-similarity
library_name: sentence-transformers
SentenceTransformer based on sentence-transformers/paraphrase-multilingual-mpnet-base-v2
This is a sentence-transformers model finetuned from sentence-transformers/paraphrase-multilingual-mpnet-base-v2. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
Model Details
Model Description
- Model Type: Sentence Transformer
- Base model: sentence-transformers/paraphrase-multilingual-mpnet-base-v2
- Maximum Sequence Length: 128 tokens
- Output Dimensionality: 768 dimensions
- Similarity Function: Cosine Similarity
Model Sources
- Documentation: Sentence Transformers Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Sentence Transformers on Hugging Face
Full Model Architecture
SentenceTransformer(
(0): Transformer({'max_seq_length': 128, 'do_lower_case': False, 'architecture': 'XLMRobertaModel'})
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
'آش تمر هندی یزد',
'عنوان: آش تمر هندی | استان: یزد | برچسب\u200cها: آش/سوپ، برنجی، حبوبات\u200cمحور | مواد: تمر هندی، نخود، لوبیا، عدس، گوشت گوسفندی، برنج، پیاز، نعنا | مراحل: تهیه مواد اولیه تمر هندی، نخود، لوبیا، عدس، گوشت گوسفندی، برنج و پیاز پختن گوشت گوسفندی پختن حبوبات (نخود، لوبیا، عدس) اضافه کردن برنج به گوشت و حبوبات اضافه کردن تمر هندی به مواد اضافه کردن پیاز تکمیل با نعنا',
'عنوان: قروت بیرجندی | استان: خراسان جنوبی | مواد: کشک، آب، گردو، پیاز داغ، نعنا داغ، نمک، فلفل سیاه، دارچین، روغن | مراحل: کشک را با کمی آب مخلوط کنید تا به شکل مایع دربیاید. گردو را تا حدی بکوبید تا روغن پس دهد و به کشک اضافه کنید. پیاز داغ و نعنا داغ را به اندازه دلخواه آماده کنید. مواد آماده\u200cشده را با هم مخلوط کنید و در قابلمه بجوشانید. مواد را با حرارت ملایم بجوشانید تا غل نزنند.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities)
# tensor([[ 1.0000, 0.8928, -0.0663],
# [ 0.8928, 1.0000, -0.0461],
# [-0.0663, -0.0461, 1.0000]])
Training Details
Training Dataset
Unnamed Dataset
- Size: 3,390 training samples
- Columns:
sentence_0andsentence_1 - Approximate statistics based on the first 1000 samples:
sentence_0 sentence_1 type string string details - min: 3 tokens
- mean: 8.24 tokens
- max: 21 tokens
- min: 62 tokens
- mean: 126.29 tokens
- max: 128 tokens
- Samples:
sentence_0 sentence_1 آش نیسک یا ساوار کردستان کردستانعنوان: آش نیسک یا ساوار کردستان | استان: کردستان | برچسبها: آش/سوپ، حبوباتمحور، سریع | مواد: سیبزمینی نگینی خرد شده، بلغور گندم، عدس، داغ، نعناع داغ برای تزیین، نمک و فلفل و زردچوبه | مراحل: عدس را پس از تمیز کردن و شستن به همراه بلغور در یک قابلمه بریزید. ۷، ۸ لیوان آب به آن اضافه کنید و روی حرارت ملایم قرار دهید تا پخته شوند. تابه کوچکی را روی حرارت قرار دهید و کمی روغن داخلش بریزید تا داغ شود. سپس زردچوبه را داخل روغن تفت میدهیم تا بوی خامی آن گرفته شود. بعد داخل زردچوبپنیر برشته گیلانعنوان: پنیر برشته | استان: گیلان | برچسبها: سریع | مواد: محلی یا (پنیر معمولی)، سیر، کره یا روغن، شوید خشک یا تازه، زردچوبه، تخممرغ | مراحل: در ظرفی پنیررا با چنگال له میکنیم و همهی مواد (شوید خشک یا تازه خردشده، سیر رنده شده، تخممرغ و زردچوبه) بجز کره را به پنیر اضافه میکنیم ماهیتابه را روی حرارت قرار دهید و کره را درآن آب کنید و قتی کره آب شد مواد مخلوط شده را به آن اضافه کنید و سریع هم بزنید ممکن است آب بیندازد آنقدر هم بزنید تا حالت سفت و خورد شدهای داشته باشدآش گندم زنجان زنجانعنوان: آش گندم زنجان | استان: زنجان | برچسبها: آش/سوپ، حبوباتمحور، سرخکردنی | مواد: نعنا خشک، زردچوبه، لوبیاچشمبلبلی، لوبیاچیتی، نمک، سیر حبه، عدس، نخود، گندم، فلفل سیاه، لوبیا سفید، ماش، روغن مایع، فلفل قرمز، آب | مراحل: آماده سازی - مرحله ۱: گندم، نخود، لوبیاسفید، لوبیا چشمبلبلی، لوبیا چیتی، ماش و عدس را جداگانه پاک کنید و بشویید. سیر و پیاز را بشویید و پوست بگیرید. پیاز را خلالی خرد کنید. سیر را رنده کرده یا با پرس سیر له کنید. پیاز را خلالی خرد کنید. سیر را رنده کرده ی - Loss:
MultipleNegativesRankingLosswith these parameters:{ "scale": 20.0, "similarity_fct": "cos_sim", "gather_across_devices": false }
Training Hyperparameters
Non-Default Hyperparameters
per_device_train_batch_size: 16per_device_eval_batch_size: 16num_train_epochs: 2multi_dataset_batch_sampler: round_robin
All Hyperparameters
Click to expand
overwrite_output_dir: Falsedo_predict: Falseeval_strategy: noprediction_loss_only: Trueper_device_train_batch_size: 16per_device_eval_batch_size: 16per_gpu_train_batch_size: Noneper_gpu_eval_batch_size: Nonegradient_accumulation_steps: 1eval_accumulation_steps: Nonetorch_empty_cache_steps: Nonelearning_rate: 5e-05weight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08max_grad_norm: 1num_train_epochs: 2max_steps: -1lr_scheduler_type: linearlr_scheduler_kwargs: {}warmup_ratio: 0.0warmup_steps: 0log_level: passivelog_level_replica: warninglog_on_each_node: Truelogging_nan_inf_filter: Truesave_safetensors: Truesave_on_each_node: Falsesave_only_model: Falserestore_callback_states_from_checkpoint: Falseno_cuda: Falseuse_cpu: Falseuse_mps_device: Falseseed: 42data_seed: Nonejit_mode_eval: Falseuse_ipex: Falsebf16: Falsefp16: Falsefp16_opt_level: O1half_precision_backend: autobf16_full_eval: Falsefp16_full_eval: Falsetf32: Nonelocal_rank: 0ddp_backend: Nonetpu_num_cores: Nonetpu_metrics_debug: Falsedebug: []dataloader_drop_last: Falsedataloader_num_workers: 0dataloader_prefetch_factor: Nonepast_index: -1disable_tqdm: Falseremove_unused_columns: Truelabel_names: Noneload_best_model_at_end: Falseignore_data_skip: Falsefsdp: []fsdp_min_num_params: 0fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap: Noneaccelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}parallelism_config: Nonedeepspeed: Nonelabel_smoothing_factor: 0.0optim: adamw_torch_fusedoptim_args: Noneadafactor: Falsegroup_by_length: Falselength_column_name: lengthddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falsedataloader_pin_memory: Truedataloader_persistent_workers: Falseskip_memory_metrics: Trueuse_legacy_prediction_loop: Falsepush_to_hub: Falseresume_from_checkpoint: Nonehub_model_id: Nonehub_strategy: every_savehub_private_repo: Nonehub_always_push: Falsehub_revision: Nonegradient_checkpointing: Falsegradient_checkpointing_kwargs: Noneinclude_inputs_for_metrics: Falseinclude_for_metrics: []eval_do_concat_batches: Truefp16_backend: autopush_to_hub_model_id: Nonepush_to_hub_organization: Nonemp_parameters:auto_find_batch_size: Falsefull_determinism: Falsetorchdynamo: Noneray_scope: lastddp_timeout: 1800torch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Noneinclude_tokens_per_second: Falseinclude_num_input_tokens_seen: Falseneftune_noise_alpha: Noneoptim_target_modules: Nonebatch_eval_metrics: Falseeval_on_start: Falseuse_liger_kernel: Falseliger_kernel_config: Noneeval_use_gather_object: Falseaverage_tokens_across_devices: Falseprompts: Nonebatch_sampler: batch_samplermulti_dataset_batch_sampler: round_robinrouter_mapping: {}learning_rate_mapping: {}
Framework Versions
- Python: 3.12.11
- Sentence Transformers: 5.1.0
- Transformers: 4.56.1
- PyTorch: 2.8.0+cu126
- Accelerate: 1.10.1
- Datasets: 4.0.0
- Tokenizers: 0.22.0
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
MultipleNegativesRankingLoss
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}