text-ft-food-rag-g1 / README.md
mamathew's picture
Upload folder using huggingface_hub
0f4f7a5 verified
metadata
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - dense
  - generated_from_trainer
  - dataset_size:3390
  - loss:MultipleNegativesRankingLoss
base_model: sentence-transformers/paraphrase-multilingual-mpnet-base-v2
widget:
  - source_sentence: دیبجا گیلان
    sentences:
      - >-
        عنوان: کلانه تره‌فرنگی برای نهار | استان: کردستان | برچسب‌ها: سرخ‌کردنی
        | مواد: تره‌فرنگی، خمیر، نمک، روغن | مراحل: ۱ خمیر همه کاری و فوری خمیر
        فوری همه‌کاره ۲ ۳ ۴ دوستان تره‌فرنگی روخرد کنید بشورید بذارید آبش بکشه
        بعد بهش نمک بزنید ۵ ۶ بعد خمیرتون روپهن کنید بعدش کمی تره‌فرنگی بریزید
        داخلش بعدش خمیر رو تا کنید و بیندازید توی روغن و هر دو طرف رو سرخ کنید
      - >-
        عنوان: دیبجا | استان: گیلان | برچسب‌ها: دریایی | مواد: دل و روده ماهی
        سفید، برگ سیر خردشده، انار ترش، نمک و فلفل و زردچوبه، روغن | مراحل:
        ابتدا دل و روده ماهی را خوب شسته و تمیز می‌کنیم و در تابه ریخته روی
        حرارت گذاشته و مرتب هم می‌زنیم تا آب اضافه آن تبخیر شود. پیازها راخرد
        کرده و در تابه دیگری پیازها را با روغن تف داده، و قتی طلایی شد برگ سیر
        را هم اضافه می‌کنیم تاکمی تف خورده و نرم شود. روده ماهی را به پیاز داغ و
        برگ سیر، به همراه نمک و فلفل و زردچوبه اضافه کرده و باهم تف 
      - >-
        عنوان: آش کشک چهارمحال و بختیاری | استان: چهارمحال و بختیاری | برچسب‌ها:
        آش/سوپ، برنجی، حبوبات‌محور، سرخ‌کردنی | مواد: روغن مایع، فلفل سیاه، سبزی
        آش، آب، کشک، نخود، برنج، زردچوبه، نعنا خشک، لوبیا سفید، نمک | مراحل: •
        برنج، نخود و لوبیا سفید را پاک کنید و بشویید. • سبزی را پاک کرده، بشویید
        و خرد کنید. • پیاز را بشویید، پوست بگیرید و نگینی خرد کنید. نخود و لوبیا
        سفید را با مقداری آب در ظروف جداگانه بپزید و آبکشی کنید. برنج را هم با
        مقداری آب در قابلمه مدنظر برای پخت آش بپزید؛ ا
  - source_sentence: آبگوشت سفید (آبگوشت ساوه)
    sentences:
      - >-
        عنوان: قتلمه | استان: مازندران | برچسب‌ها: دریایی، سرخ‌کردنی | مواد:
        شیر، ارد، پیازچه، نمک، تخم‌مرغ، خمیرمایه، شکر | مراحل: ابتدا شیر را گرم
        می‌کنیم و لی داغ نباشد. خمیرمایه و شکر را اضافه می‌کنیم ده دقیقه
        می‌ماند. در ظرفی تخم‌مرغ را می‌زنیم و هم می‌زنیم، نمک می‌زنیم. شیر و
        مایه‌خمیر را اضافه می‌کنیم. ارد را الک کرده و کم‌کم اضافه می‌کنیم تا
        حالت خمیر کیک را بگیرد. پیازچه خرد شده را اضافه می‌کنیم. بعد از یک ساعت
        استراحت به مایه در ظرف مناسب سرخ می‌کنیم. بهتر است با ملاقه از م
      - >-
        عنوان: نان کماج تبریز | استان: آذربایجان شرقی | برچسب‌ها: دریایی،
        فرپز/تنوری، نانی/آردی | مواد: آرد فانتزی، تخم‌مرغ، آب، شیر، شکر، روغن
        مایع، خمیر مایه فوری، بهبود دهنده، نمک، خامه صبحانه، عسل، زرده تخم‌مرغ،
        خامه، کنجد مقداری | مراحل: ابتدا خمیر مایه اگر فوری نبود را لا ۱ قاشق
        شکر و کمی آب می‌گذاریم تا عمل بیاد. آرد را داخل یک ظرف گود می‌ریزیم و
        همه مواد غیر از آب را به آرد اضافه می‌کنیم. با دست خمیر را جمع می‌کنیم،
        آب را کم‌کم اضافه می‌کنیم تا جایی که یک خمیر نرم و نه شل بدس
      - >-
        عنوان: آبگوشت سفید (آبگوشت ساوه) | استان: مرکزی | برچسب‌ها: سرخ‌کردنی |
        مواد: گوشت آبگوشتی گوسفند، دنبه، سیب‌زمینی، زردچوبه | مراحل: من چون
        می‌خواستم چربی این غذا رو در پخت و پزهای بعدی استفاده کنم مقدار دنبه
        زیادی رو گذاشتم پخت و بعد برداشتم کنار گذاشتم. گوشت و آب رو با هم جوش
        دادم و قتی کف کرد آب رو دور ریختم و گدشت رو شستم. بعد پیاز را خرد
        می‌کنیم. گوشت و پیاز خام را میذاریم تا حسابی بپزه یه تکه از دنبه‌ام
        می‌ریزیم بقیشو کنار میذاریم. (من داخل زودپز دستساز پختم.) سیب‌زمینی
  - source_sentence: حلوا انگشت پیچ بوشهری بوشهر
    sentences:
      - >-
        عنوان: حلوا انگشت پیچ بوشهری | استان: بوشهر | برچسب‌ها: دسر/شیرینی |
        مواد: آرد سفید قنادی، آرد گندم، شکر، آب جوش، گلاب، روغن | مراحل: برای
        درست کردن حلوا انگشت پیچ بوشهری ابتدا باید شکر را داخل یک ظرف ریخته و به
        آن آب جوش اضافه کنید. بعد از این مرحله باید شکر به طور کامل در آب حل
        شود. در همین حین تا زمانیکه شکر در آب حل شود گلاب را اضافه می‌کنیم و
        کنار می‌گذاریم. داخل یک قابلمه آرد‌ها را به خوبی و با صبر و حوصله زیاد
        الک می‌کنیم. سپس مقداری روغن اضافه می‌کنیم تا مخلوط همانند 
      - >-
        عنوان: آش لخشک | استان: خراسان رضوی | برچسب‌ها: آش/سوپ، برنجی،
        حبوبات‌محور | مواد: مرغ، لپه، برنج، ماست، پیاز، نعنا، زعفران | مراحل:
        مرغ، لپه، و برنج را آماده کنید. اش را بپزید. اش را با ماست ترکیب کنید.
        ماست را سریع هم بزنید. اش را در ظرف سرو کنید. روی‌اش را با پیاز داغ،
        نعنا داغ و زعفران تزئین کنید.
      - >-
        عنوان: خورش تره کوهی ایلام | استان: ایلام | برچسب‌ها: حبوبات‌محور، خورش،
        سرخ‌کردنی | مواد: گوشت گوسفندی یا گوساله، تره ساطوری شده، لوبیا سفید یا
        لوبیا قرمز، لیمو، نمک، زردچوبه، فلفل قرمز، روغن، زعفران دمکرده،
        سیبزمینی، گوجه‌فرنگی | مراحل: لوبیا را از شب قبل خیس کنید و چند بار آب
        آن را عوض کنید. در قابلمه روغن بریزید و پیاز خرد شده را تفت دهید تا سبک
        و شیشهای شود. گوشت خرد شده را اضافه کنید و برای ۵ دقیقه سرخ کنید. لوبیا
        را به همراه زردچوبه در قابلمه بریزید و برای ۲ دقیقه دیگر
  - source_sentence: شله ارده خوزستان
    sentences:
      - >-
        عنوان: کباب کوبیده سنتی قمی | استان: قم | برچسب‌ها: کباب/گریل | مواد:
        گوشت گوساله، قلوه‌گاه گوسفندی، زعفران دم‌کرده، نمک، فلفل، زردچوبه، رنده
        ریز شده | مراحل: همه مواد را جداگانه آماده کنید. گوشت را یک‌بار بچرخاند.
        گوشت را دوباره با چرخ‌گوشت ایرانی پارس خزر بچرخاند. گوشت را تا حدی که
        سفید شود، خوب تفت دهید. تمام مواد را روی گوشت بریزید. نیم ساعت مواد را
        به خوبی ماساژ دهید. گوشت را به شکل دوکی برش دهید. دستگاه سیخکوب را روی
        میز قرار دهید. دوک گوشت را خیس کنید. نایلون فریزر را 
      - >-
        عنوان: شله ارده | استان: خوزستان | برچسب‌ها: برنجی، حبوبات‌محور، سریع |
        مواد: ماش، برنج نیمدانه، برگ چغندر، چغندر، ارده، نمک | مراحل: برگ چغندر
        را ریز خرد کنید و همراه با چغندرهایی که درشت خرد کردهاید و سه لیتر آب در
        قابلمه بریزید. ماش و برنج را به این مواد اضافه کنید و اجازه دهید که با
        هم بپزند. در آخر به غذا نمک بزنید. بعد از پخت کامل، زیر قابلمه را خاموش
        کنید و ارده را در آن بریزید
      - >-
        عنوان: آش لعابی | استان: اصفهان | برچسب‌ها: آش/سوپ، حبوبات‌محور،
        سرخ‌کردنی | مواد: زردچوبه، بلغور گندم، آب، نمک، فلفل سیاه، روغن مایع،
        لوبیا سفید | مراحل: گوشت را تمیز بشویید تا مو و خرده استخوانی به آن
        نماند. لوبیا را پاک کنید و بشویید. پیازها را بشویید و پوست بگیرید، سپس
        نصفشان را کامل نگه دارید و نصف دیگر را خلالی یا نگینی خرد کنید. گوشت،
        لوبیا سفید و پیاز درسته را با مقداری آب بار بگذارید. می‌توانید به روش
        پخت گوشت مراجعه کنید تا گوشت و آب‌گوشت خوش طعمتری داشته باشید. در 
  - source_sentence: آش تمر هندی یزد
    sentences:
      - >-
        عنوان: دنی و دیمه دنی | استان: خراسان شمالی | برچسب‌ها: حبوبات‌محور |
        مواد: گندم کامل، گندم نیم کوب پوست‌کنده، لوبیا، عدس، نخود، آب، پیاز داغ
        | مراحل: انتخاب نوع گندم (گندم کامل یا گندم نیم کوب پوست‌کنده) خیساندن
        حبوبات (لوبیا، عدس، نخود) در آب قلم پخت حبوبات با آب قلم به آرامی تا
        غلظت حلیم اضافه کردن پیاز داغ (در صورت تمایل)
      - >-
        عنوان: آش تمر هندی | استان: یزد | برچسب‌ها: آش/سوپ، برنجی، حبوبات‌محور |
        مواد: تمر هندی، نخود، لوبیا، عدس، گوشت گوسفندی، برنج، پیاز، نعنا |
        مراحل: تهیه مواد اولیه تمر هندی، نخود، لوبیا، عدس، گوشت گوسفندی، برنج و
        پیاز پختن گوشت گوسفندی پختن حبوبات (نخود، لوبیا، عدس) اضافه کردن برنج به
        گوشت و حبوبات اضافه کردن تمر هندی به مواد اضافه کردن پیاز تکمیل با نعنا
      - >-
        عنوان: قروت بیرجندی | استان: خراسان جنوبی | مواد: کشک، آب، گردو، پیاز
        داغ، نعنا داغ، نمک، فلفل سیاه، دارچین، روغن | مراحل: کشک را با کمی آب
        مخلوط کنید تا به شکل مایع دربیاید. گردو را تا حدی بکوبید تا روغن پس دهد
        و به کشک اضافه کنید. پیاز داغ و نعنا داغ را به اندازه دلخواه آماده کنید.
        مواد آماده‌شده را با هم مخلوط کنید و در قابلمه بجوشانید. مواد را با
        حرارت ملایم بجوشانید تا غل نزنند.
pipeline_tag: sentence-similarity
library_name: sentence-transformers

SentenceTransformer based on sentence-transformers/paraphrase-multilingual-mpnet-base-v2

This is a sentence-transformers model finetuned from sentence-transformers/paraphrase-multilingual-mpnet-base-v2. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 128, 'do_lower_case': False, 'architecture': 'XLMRobertaModel'})
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
    'آش تمر هندی یزد',
    'عنوان: آش تمر هندی | استان: یزد | برچسب\u200cها: آش/سوپ، برنجی، حبوبات\u200cمحور | مواد: تمر هندی، نخود، لوبیا، عدس، گوشت گوسفندی، برنج، پیاز، نعنا | مراحل: تهیه مواد اولیه تمر هندی، نخود، لوبیا، عدس، گوشت گوسفندی، برنج و پیاز پختن گوشت گوسفندی پختن حبوبات (نخود، لوبیا، عدس) اضافه کردن برنج به گوشت و حبوبات اضافه کردن تمر هندی به مواد اضافه کردن پیاز تکمیل با نعنا',
    'عنوان: قروت بیرجندی | استان: خراسان جنوبی | مواد: کشک، آب، گردو، پیاز داغ، نعنا داغ، نمک، فلفل سیاه، دارچین، روغن | مراحل: کشک را با کمی آب مخلوط کنید تا به شکل مایع دربیاید. گردو را تا حدی بکوبید تا روغن پس دهد و به کشک اضافه کنید. پیاز داغ و نعنا داغ را به اندازه دلخواه آماده کنید. مواد آماده\u200cشده را با هم مخلوط کنید و در قابلمه بجوشانید. مواد را با حرارت ملایم بجوشانید تا غل نزنند.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities)
# tensor([[ 1.0000,  0.8928, -0.0663],
#         [ 0.8928,  1.0000, -0.0461],
#         [-0.0663, -0.0461,  1.0000]])

Training Details

Training Dataset

Unnamed Dataset

  • Size: 3,390 training samples
  • Columns: sentence_0 and sentence_1
  • Approximate statistics based on the first 1000 samples:
    sentence_0 sentence_1
    type string string
    details
    • min: 3 tokens
    • mean: 8.24 tokens
    • max: 21 tokens
    • min: 62 tokens
    • mean: 126.29 tokens
    • max: 128 tokens
  • Samples:
    sentence_0 sentence_1
    آش نیسک یا ساوار کردستان کردستان عنوان: آش نیسک یا ساوار کردستان | استان: کردستان | برچسب‌ها: آش/سوپ، حبوبات‌محور، سریع | مواد: سیبزمینی نگینی خرد شده، بلغور گندم، عدس، داغ، نعناع داغ برای تزیین، نمک و فلفل و زردچوبه | مراحل: عدس را پس از تمیز کردن و شستن به همراه بلغور در یک قابلمه بریزید. ۷، ۸ لیوان آب به آن اضافه کنید و روی حرارت ملایم قرار دهید تا پخته شوند. تابه کوچکی را روی حرارت قرار دهید و کمی روغن داخلش بریزید تا داغ شود. سپس زردچوبه را داخل روغن تفت می‌دهیم تا بوی خامی آن گرفته شود. بعد داخل زردچوب
    پنیر برشته گیلان عنوان: پنیر برشته | استان: گیلان | برچسب‌ها: سریع | مواد: محلی یا (پنیر معمولی)، سیر، کره یا روغن، شوید خشک یا تازه، زردچوبه، تخم‌مرغ | مراحل: در ظرفی پنیررا با چنگال له می‌کنیم و همه‌ی مواد (شوید خشک یا تازه خردشده، سیر رنده شده، تخم‌مرغ و زردچوبه) بجز کره را به پنیر اضافه می‌کنیم ماهی‌تابه را روی حرارت قرار دهید و کره را درآن آب کنید و قتی کره آب شد مواد مخلوط شده را به آن اضافه کنید و سریع هم بزنید ممکن است آب بیندازد آنقدر هم بزنید تا حالت سفت و خورد شده‌ای داشته باشد
    آش گندم زنجان زنجان عنوان: آش گندم زنجان | استان: زنجان | برچسب‌ها: آش/سوپ، حبوبات‌محور، سرخ‌کردنی | مواد: نعنا خشک، زردچوبه، لوبیاچشمبلبلی، لوبیاچیتی، نمک، سیر حبه، عدس، نخود، گندم، فلفل سیاه، لوبیا سفید، ماش، روغن مایع، فلفل قرمز، آب | مراحل: آماده سازی - مرحله ۱: گندم، نخود، لوبیاسفید، لوبیا چشمبلبلی، لوبیا چیتی، ماش و عدس را جداگانه پاک کنید و بشویید. سیر و پیاز را بشویید و پوست بگیرید. پیاز را خلالی خرد کنید. سیر را رنده کرده یا با پرس سیر له کنید. پیاز را خلالی خرد کنید. سیر را رنده کرده ی
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim",
        "gather_across_devices": false
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • per_device_train_batch_size: 16
  • per_device_eval_batch_size: 16
  • num_train_epochs: 2
  • multi_dataset_batch_sampler: round_robin

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: no
  • prediction_loss_only: True
  • per_device_train_batch_size: 16
  • per_device_eval_batch_size: 16
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 5e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1
  • num_train_epochs: 2
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.0
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: False
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • parallelism_config: None
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch_fused
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: None
  • hub_always_push: False
  • hub_revision: None
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • include_for_metrics: []
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • liger_kernel_config: None
  • eval_use_gather_object: False
  • average_tokens_across_devices: False
  • prompts: None
  • batch_sampler: batch_sampler
  • multi_dataset_batch_sampler: round_robin
  • router_mapping: {}
  • learning_rate_mapping: {}

Framework Versions

  • Python: 3.12.11
  • Sentence Transformers: 5.1.0
  • Transformers: 4.56.1
  • PyTorch: 2.8.0+cu126
  • Accelerate: 1.10.1
  • Datasets: 4.0.0
  • Tokenizers: 0.22.0

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MultipleNegativesRankingLoss

@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply},
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}