DGSMsRzJ6xC2JthtHG9W commited on
Commit
6acc220
·
verified ·
1 Parent(s): 3ad4613

Add new SentenceTransformer model

Browse files
.gitattributes CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 768,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,937 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - en
4
+ license: apache-2.0
5
+ tags:
6
+ - sentence-transformers
7
+ - sentence-similarity
8
+ - feature-extraction
9
+ - generated_from_trainer
10
+ - dataset_size:73821
11
+ - loss:MatryoshkaLoss
12
+ - loss:MultipleNegativesRankingLoss
13
+ base_model: nomic-ai/nomic-embed-text-v2-moe
14
+ widget:
15
+ - source_sentence: Кто устанавливает порядок рассмотрения возражений против предоставления
16
+ правовой охраны географическому указанию?
17
+ sentences:
18
+ - 1. Должник, извещенный поручителем о предъявленном к нему кредитором требовании
19
+ или привлеченный поручителем к участию в деле, обязан сообщить поручителю обо
20
+ всех имеющихся у него возражениях против этого требования и предоставить имеющиеся
21
+ у него в подтверждение этих требований доказательства. В противном случае должник
22
+ лишается права выдвигать возражения, которые могли быть заявлены против требования
23
+ кредитора, против требования поручителя (пункт 1 статьи 365), если иное не предусмотрено
24
+ соглашением между поручителем и должником. 2. Должник, исполнивший обязательство,
25
+ обеспеченное поручительством, обязан известить об этом поручителя немедленно.
26
+ В противном случае поручитель, в свою очередь исполнивший свое обязательство,
27
+ вправе взыскать с кредитора неосновательно полученное или предъявить регрессное
28
+ требование к должнику. В последнем случае должник вправе взыскать с кредитора
29
+ лишь неосновательно полученное. (Статья в редакции Федерального закона от 08.03.2015
30
+ № 42-ФЗ )
31
+ - 1. Продавец отвечает за недостатки товара, если покупатель докажет, что недостатки
32
+ товара возникли до его передачи покупателю или по причинам, возникшим до этого
33
+ момента. 2. В отношении товара, на который продавцом предоставлена гарантия качества,
34
+ продавец отвечает за недостатки товара, если не докажет, что недостатки товара
35
+ возникли после его передачи покупателю вследствие нарушения покупателем правил
36
+ пользования товаром или его хранения, либо действий третьих лиц, либо непреодолимой
37
+ силы.
38
+ - 2. Принятие решений, предусмотренных пунктом 1 настоящей статьи, влечет за собой
39
+ отмену решения о государственной регистрации географического указания и (или)
40
+ о предоставлении исключительного права на географическое указание (статья 1525)
41
+ либо решения о предоставлении правовой охраны на территории Российской Федерации
42
+ географическому указанию, зарегистрированному в соответствии с международным договором
43
+ Российской Федерации, и (или) предоставлении исключительного права на такое географическое
44
+ указание или решения об отказе в предоставлении правовой охраны на территории
45
+ Российской Федерации географическому указанию, зарегистрированному в соответствии
46
+ с международным договором Российской Федерации, и (или) предоставлении исключительного
47
+ права на такое географическое указание. (В редакции Федерального закона от 05.12.2022
48
+ № 503-ФЗ ) 3. Порядок рассмотрения возражений против предоставления правовой охраны
49
+ географическому указанию и (или) против предоставления исключительного права на
50
+ географическое указание устанавливается федеральным органом исполнительной власти,
51
+ осуществляющим нормативно-правовое регулирование в сфере интеллектуальной собственности.
52
+ (Статья в редакции Федерального закона от 26.07.2019 № 230-ФЗ )
53
+ - source_sentence: Публичное акционерное общество "Гамма" планирует разместить обыкновенные
54
+ акции, составляющие 30% от ранее размещенных обыкновенных акций, посредством открытой
55
+ подписки. Какое решение общего собрания акционеров необходимо для размещения обыкновенных
56
+ акций в ПАО "Гамма" посредством открытой подписки, согласно предоставленному тексту
57
+ статьи закона? Устав общества не содержит особых требований к кворуму.
58
+ sentences:
59
+ - 1. Срок действия исключительного права на селекционное достижение и удостоверяющего
60
+ это право патента исчисляется со дня государственной регистрации селекционного
61
+ достижения в Государственном реестре охраняемых селекционных достижений и составляет
62
+ тридцать лет. 2. На сорта винограда, древесных декоративных, плодовых культур
63
+ и лесных пород, в том числе их подвоев, срок действия исключительного права и
64
+ удостоверяющего это право патента составляет тридцать пять лет.
65
+ - Не является нарушением исключительного права на товарный знак использование этого
66
+ товарного знака другими лицами в отношении товаров, которые были введены в гражданский
67
+ оборот на территории Российской Федерации непосредственно правообладателем или
68
+ с его согласия.
69
+ - Размещение посредством закрытой подписки привилегированных акций, предусмотренных
70
+ пунктом 6 статьи 32 настоящего Федерального закона, осуществляется только по решению
71
+ общего собрания акционеров об увеличении уставного капитала общества путем размещения
72
+ указанных привилегированных акций, принятому единогласно всеми акционерами общества.
73
+ (Дополнение абзацем - Федеральный закон от 29.06.2015 № 210-ФЗ ) Размещение путем
74
+ закрытой подписки дополнительных акций во исполнение договора конвертируемого
75
+ займа осуществляется только по решению общего собрания акционеров заемщика, являющегося
76
+ непубличным обществом, об увеличении уставного капитала такого общества путем
77
+ размещения дополнительных акций, принятому единогласно всеми акционерами этого
78
+ общества. (Дополнение абзацем - Федеральный закон от 02.07.2021 № 354-ФЗ ) 4.
79
+ Размещение посредством открытой подписки обыкновенных акций, составляющих более
80
+ 25 процентов ранее размещенных обыкновенных акций, осуществляется только по решению
81
+ общего собрания акционеров, принятому большинством в три четверти голосов акционеров
82
+ - владельцев голосующих акций, принимающих участие в общем собрании акционеров,
83
+ если необходимость большего числа голосов для принятия этого решен��я не предусмотрена
84
+ уставом общества. Размещение посредством открытой подписки конвертируемых в обыкновенные
85
+ акции эмиссионных ценных бумаг, которые могут быть конвертированы в обыкновенные
86
+ акции, составляющие более 25 процентов ранее размещенных обыкновенных акций, осуществляется
87
+ только по решению общего собрания акционеров, принятому большинством в три четверти
88
+ голосов акционеров - владельцев голосующих акций, принимающих участие в общем
89
+ собрании акционеров, если необходимость большего числа голосов для принятия этого
90
+ решения не предусмотрена уставом общества.
91
+ - source_sentence: 'Банк может обратиться в суд с требованием о расторжении договора
92
+ банковского счета в следующих ситуациях:'
93
+ sentences:
94
+ - 5. В случае неисполнения оператором лотереи, организатором игр указанной в пункте
95
+ 4 настоящей статьи обязанности участник, выигравший в лотерее, тотализаторе или
96
+ иных играх, вправе требовать от оператора лотереи, организатора игр выплаты выигрыша,
97
+ а также возмещения убытков, причиненных нарушением договора со стороны оператора
98
+ лотереи, организатора игр. (В редакции Федерального закона от 28.12.2013 № 416-ФЗ
99
+ )
100
+ - Наследник, проживавший на день открытия наследства совместно с наследодателем,
101
+ имеет при разделе наследства преимущественное право на получение в счет своей
102
+ наследственной доли предметов обычной домашней обстановки и обихода.
103
+ - 'Со дня направления банком клиенту уведомления о расторжении договора банковского
104
+ счета до дня, когда договор считается расторгнутым, банк не вправе осуществлять
105
+ операции по банковскому счету клиента, за исключением операций по взиманию платы
106
+ за услуги банка, начислению процентов, если такие условия содержатся в договоре
107
+ банковского счета, по перечислению обязательных платежей в бюджет и операций,
108
+ предусмотренных пунктами 5 и 6 настоящей статьи. 4. По требованию банка договор
109
+ банковского счета может быть расторгнут судом в следующих случаях: когда сумма
110
+ денежных средств, находящихся на счете клиента, окажется ниже минимального размера,
111
+ предусмотренного банковскими правилами или договором, если такая сумма не будет
112
+ восстановлена в течение месяца со дня предупреждения банка об этом; при отсутствии
113
+ операций по этому счету в течение года, если иное не предусмотрено договором.
114
+ 5. Остаток денежных средств на счете выдается клиенту либо по его указанию перечисляется
115
+ на другой счет не позднее семи дней после получения соответствующего письменного
116
+ заявления клиента, за исключением случаев, предусмотренных пунктом 3 статьи 858
117
+ настоящего Кодекса.'
118
+ - source_sentence: Индивидуальный предприниматель Иванов является учредителем ООО
119
+ "Гамма". ООО "Гамма" не выполнило свои обязательства перед клиентом. Несет ли
120
+ Иванов личную ответственность по долгам ООО "Гам��а"?
121
+ sentences:
122
+ - 1. Юридическое лицо отвечает по своим обязательствам всем принадлежащим ему имуществом.
123
+ Особенности ответственности казенного предприятия и учреждения по своим обязательствам
124
+ определяются правилами абзаца третьего пункта 6 статьи 113, пункта 3 статьи 123.21,
125
+ пунктов 3 - 6 статьи 123.22 и пункта 2 статьи 123.23 настоящего Кодекса. Особенности
126
+ ответственности религиозной организации определяются правилами пункта 2 статьи
127
+ 123.28 настоящего Кодекса. 2. Учредитель (участник) юридического лица или собственник
128
+ его имущества не отвечает по обязательствам юридического лица, а юридическое лицо
129
+ не отвечает по обязательствам учредителя (участника) или собственника, за исключением
130
+ случаев, предусмотренных настоящим Кодексом или другим законом. (Статья в редакции
131
+ Федерального закона от 05.05.2014 № 99-ФЗ )
132
+ - Цена покупки доли или части доли в уставном капитале может устанавливаться уставом
133
+ общества в твердой денежной сумме или на основании одного из критериев, определяющих
134
+ стоимость доли (стоимость чистых активов общества, балансовая стоимость активов
135
+ общества на последнюю отчетную дату, чистая прибыль общества и другие). Заранее
136
+ определенная уставом цена покупки доли или части доли должна быть одинаковой для
137
+ всех участников общества вне зависимости от принадлежности такой доли или такой
138
+ части доли в уставном капитале общества. Положения, устанавливающие преимущественное
139
+ право покупки доли или части доли в уставном капитале участниками общества или
140
+ обществом по заранее определенной уставом цене, в том числе изменение размера
141
+ такой цены или порядка ее определения, могут быть предусмотрены уставом общества
142
+ при его учреждении или при внесении изменений в устав общества по решению общего
143
+ собрания участников общества, принятому всеми участниками общества единогласно.
144
+ Исключение из устава общества положений, устанавливающих преимущественное право
145
+ покупки доли или части доли в уставном капитале общества по заранее определенной
146
+ уставом цене, осуществляется по решению общего собрания участников общества, принятому
147
+ двумя третями голосов от общего числа голосов участников общества.
148
+ - 1. До предъявления к перевозчику иска, вытекающего из перевозки груза, обязательно
149
+ предъявление ему претензии в порядке, предусмотренном соответствующим транспортным
150
+ уставом или кодексом. 2. Иск к перевозчику может быть предъявлен грузоотправителем
151
+ или грузополучателем в случае полного или частичного отказа перевозчика удовлетворить
152
+ претензию либо неполучения от перевозчика ответа в тридцатидневный срок. 3. Срок
153
+ исковой давности по требованиям, вытекающим из перевозки груза, устанавливается
154
+ в один год с момента, определяемого в соответствии с транспортными уставами и
155
+ кодексами.
156
+ - source_sentence: Кто может быть включен в состав ликвидационной комиссии, если участником
157
+ ликвидируемого общества является государство или муниципальное образование?
158
+ sentences:
159
+ - 1. В соответствии с Гражданским кодексом Российской Федерации настоящий Федеральный
160
+ закон определяет порядок создания, реорганизации, ликвидации, правовое положение
161
+ акционерных обществ, права и обязанности их акционеров, а также обеспечивает защиту
162
+ прав и интересов акционеров. (В редакции Федерального закона от 07.08.2001 № 120-ФЗ
163
+ ) 1.1. (Дополнение пунктом - Федеральный закон от 21.07.2014 № 218-ФЗ ) (Утратил
164
+ силу - Федеральный закон от 29.06.2015 № 210-ФЗ ) 2. Настоящий Федеральный закон
165
+ распространяется на все акционерные общества, созданные или создаваемые на территории
166
+ Российской Федерации, если иное не установлено настоящим Федеральным законом и
167
+ иными федеральными законами. 3. Особенности создания, реорганизации, ликвидации
168
+ и правового положения акционерных обществ, являющихся кредитными организациями,
169
+ страховыми организациями, клиринговыми организациями, специализированными финансовыми
170
+ обществами, специализированными обществами проектного финансирования, профессиональными
171
+ участниками рынка ценных бумаг, акционерными инвестиционными фондами, управляющими
172
+ компаниями инвестиционных фондов, паевых инвестиционных фондов и негосударственных
173
+ пенсионных фондов, негосударственными пенсионными фондами и иными некредитными
174
+ финансовыми организациями, акционерными обществами работников (народными предприятиями),
175
+ а также прав и обязанностей акционеров таких акционерных обществ определяются
176
+ федеральными законами, регулирующими их деятельность. (В редакции Федерального
177
+ закона от 29.06.2015 № 210-ФЗ )
178
+ - 1. Общество может быть ликвидировано добровольно в порядке, установленном Гражданским
179
+ кодексом Российской Федерации , с учетом требований настоящего Федерального закона
180
+ и устава общества. Общество может быть ликвидировано также по решению суда по
181
+ основаниям, предусмотренным Гражданским кодексом Российской Федерации . Ликвидация
182
+ общества влечет за собой его прекращение без перехода прав и обязанностей в порядке
183
+ правопреемства к другим лицам. 2. Решение общего собрания участников общества
184
+ о добровольной ликвидации общества и назначении ликвидационной комиссии принимается
185
+ по предложению совета директоров (наблюдательного совета) общества, исполнительного
186
+ органа или участника общества. Общее собрание участников добровольно ликвидируемого
187
+ общества принимает решение о ликвидации общества и назначении ликвидационной комиссии.
188
+ (В редакции Федерального закона от 21.03.2002 № 31-ФЗ ) 3. С момента назначения
189
+ ликвидационной комиссии к ней переходят все полномочия по управлению делами общества.
190
+ Ликвидационная комиссия от имени ликвидируемого общества выступает в суде. 4.
191
+ В случае, если участником ликвидируемого общества является Российская Федерация,
192
+ субъект Российской Федерации или муниципальное образование, в состав ликвидационной
193
+ комиссии включается представитель федерального органа по управлению государственным
194
+ имуществом, специализированного учреждения, осуществляющего продажу федерального
195
+ имущества, органа по управлению государственным имуществом субъекта Российской
196
+ Федерации, продавца государственного имущества субъекта Российской Федерации или
197
+ органа местного самоуправления. (В редакции Федерального закона от 21.03.2002
198
+ № 31-ФЗ ) 5. Порядок ликвидации общества определяется Гражданским кодексом Российской
199
+ Федерации и другими федеральными законами.
200
+ - 1. По договору банковского вклада (депозита) одна сторона (банк), принявшая поступившую
201
+ от другой стороны (вкладчика) или поступившую для нее денежную сумму (вклад),
202
+ обязуется возвратить сумму вклада и выплатить проценты на нее на условиях и в
203
+ порядке, предусмотренных договором. Если иное не предусмотрено законом, по просьбе
204
+ вкладчика-гражданина банк вместо выдачи вклада и процентов на него должен произвести
205
+ перечисление денежных средств на указанный вкладчиком счет. (В редакции Федерального
206
+ закона от 26.07.2017 № 212-ФЗ ) 2. Договор банковского вклада, в котором вкладчиком
207
+ является гражданин, признается публичным договором (статья 426). 3. К отношениям
208
+ банка и вкладчика по счету, на который внесен вклад, применяются правила о договоре
209
+ банковского счета (глава 45), если иное не предусмотрено правилами настоящей главы
210
+ или не вытекает из существа договора банковского вклада. Если иное не предусмотрено
211
+ законом, юридические лица не вправе перечислять находящиеся во вкладах (депозитах)
212
+ денежные средства другим лицам. (В редакции Федерального закона от 26.07.2017
213
+ № 212-ФЗ ) 4. Правила настоящей главы, относящиеся к банкам, применяются также
214
+ к другим кредитным организациям, принимающим в соответствии с законом вклады (депозиты)
215
+ от юридических лиц.
216
+ pipeline_tag: sentence-similarity
217
+ library_name: sentence-transformers
218
+ metrics:
219
+ - cosine_accuracy@1
220
+ - cosine_accuracy@3
221
+ - cosine_accuracy@5
222
+ - cosine_accuracy@10
223
+ - cosine_precision@1
224
+ - cosine_precision@3
225
+ - cosine_precision@5
226
+ - cosine_precision@10
227
+ - cosine_recall@1
228
+ - cosine_recall@3
229
+ - cosine_recall@5
230
+ - cosine_recall@10
231
+ - cosine_ndcg@10
232
+ - cosine_mrr@10
233
+ - cosine_map@100
234
+ model-index:
235
+ - name: nomic v2 tune
236
+ results:
237
+ - task:
238
+ type: information-retrieval
239
+ name: Information Retrieval
240
+ dataset:
241
+ name: dim 768
242
+ type: dim_768
243
+ metrics:
244
+ - type: cosine_accuracy@1
245
+ value: 0.028648055589418506
246
+ name: Cosine Accuracy@1
247
+ - type: cosine_accuracy@3
248
+ value: 0.08411556747531392
249
+ name: Cosine Accuracy@3
250
+ - type: cosine_accuracy@5
251
+ value: 0.13324393514567842
252
+ name: Cosine Accuracy@5
253
+ - type: cosine_accuracy@10
254
+ value: 0.24125320004876266
255
+ name: Cosine Accuracy@10
256
+ - type: cosine_precision@1
257
+ value: 0.028648055589418506
258
+ name: Cosine Precision@1
259
+ - type: cosine_precision@3
260
+ value: 0.0280385224917713
261
+ name: Cosine Precision@3
262
+ - type: cosine_precision@5
263
+ value: 0.026648787029135684
264
+ name: Cosine Precision@5
265
+ - type: cosine_precision@10
266
+ value: 0.024125320004876265
267
+ name: Cosine Precision@10
268
+ - type: cosine_recall@1
269
+ value: 0.028648055589418506
270
+ name: Cosine Recall@1
271
+ - type: cosine_recall@3
272
+ value: 0.08411556747531392
273
+ name: Cosine Recall@3
274
+ - type: cosine_recall@5
275
+ value: 0.13324393514567842
276
+ name: Cosine Recall@5
277
+ - type: cosine_recall@10
278
+ value: 0.24125320004876266
279
+ name: Cosine Recall@10
280
+ - type: cosine_ndcg@10
281
+ value: 0.11480634699241679
282
+ name: Cosine Ndcg@10
283
+ - type: cosine_mrr@10
284
+ value: 0.0770315834895868
285
+ name: Cosine Mrr@10
286
+ - type: cosine_map@100
287
+ value: 0.10400292372556541
288
+ name: Cosine Map@100
289
+ - task:
290
+ type: information-retrieval
291
+ name: Information Retrieval
292
+ dataset:
293
+ name: dim 512
294
+ type: dim_512
295
+ metrics:
296
+ - type: cosine_accuracy@1
297
+ value: 0.027428989394124102
298
+ name: Cosine Accuracy@1
299
+ - type: cosine_accuracy@3
300
+ value: 0.07826404973790077
301
+ name: Cosine Accuracy@3
302
+ - type: cosine_accuracy@5
303
+ value: 0.12922101670120686
304
+ name: Cosine Accuracy@5
305
+ - type: cosine_accuracy@10
306
+ value: 0.23893697427770327
307
+ name: Cosine Accuracy@10
308
+ - type: cosine_precision@1
309
+ value: 0.027428989394124102
310
+ name: Cosine Precision@1
311
+ - type: cosine_precision@3
312
+ value: 0.026088016579300256
313
+ name: Cosine Precision@3
314
+ - type: cosine_precision@5
315
+ value: 0.025844203340241376
316
+ name: Cosine Precision@5
317
+ - type: cosine_precision@10
318
+ value: 0.023893697427770328
319
+ name: Cosine Precision@10
320
+ - type: cosine_recall@1
321
+ value: 0.027428989394124102
322
+ name: Cosine Recall@1
323
+ - type: cosine_recall@3
324
+ value: 0.07826404973790077
325
+ name: Cosine Recall@3
326
+ - type: cosine_recall@5
327
+ value: 0.12922101670120686
328
+ name: Cosine Recall@5
329
+ - type: cosine_recall@10
330
+ value: 0.23893697427770327
331
+ name: Cosine Recall@10
332
+ - type: cosine_ndcg@10
333
+ value: 0.11220919763732407
334
+ name: Cosine Ndcg@10
335
+ - type: cosine_mrr@10
336
+ value: 0.07445988594958501
337
+ name: Cosine Mrr@10
338
+ - type: cosine_map@100
339
+ value: 0.10143395119480365
340
+ name: Cosine Map@100
341
+ - task:
342
+ type: information-retrieval
343
+ name: Information Retrieval
344
+ dataset:
345
+ name: dim 256
346
+ type: dim_256
347
+ metrics:
348
+ - type: cosine_accuracy@1
349
+ value: 0.027428989394124102
350
+ name: Cosine Accuracy@1
351
+ - type: cosine_accuracy@3
352
+ value: 0.08070218212848958
353
+ name: Cosine Accuracy@3
354
+ - type: cosine_accuracy@5
355
+ value: 0.1250761916372059
356
+ name: Cosine Accuracy@5
357
+ - type: cosine_accuracy@10
358
+ value: 0.23820553456052665
359
+ name: Cosine Accuracy@10
360
+ - type: cosine_precision@1
361
+ value: 0.027428989394124102
362
+ name: Cosine Precision@1
363
+ - type: cosine_precision@3
364
+ value: 0.026900727376163187
365
+ name: Cosine Precision@3
366
+ - type: cosine_precision@5
367
+ value: 0.025015238327441177
368
+ name: Cosine Precision@5
369
+ - type: cosine_precision@10
370
+ value: 0.023820553456052662
371
+ name: Cosine Precision@10
372
+ - type: cosine_recall@1
373
+ value: 0.027428989394124102
374
+ name: Cosine Recall@1
375
+ - type: cosine_recall@3
376
+ value: 0.08070218212848958
377
+ name: Cosine Recall@3
378
+ - type: cosine_recall@5
379
+ value: 0.1250761916372059
380
+ name: Cosine Recall@5
381
+ - type: cosine_recall@10
382
+ value: 0.23820553456052665
383
+ name: Cosine Recall@10
384
+ - type: cosine_ndcg@10
385
+ value: 0.11212226572647588
386
+ name: Cosine Ndcg@10
387
+ - type: cosine_mrr@10
388
+ value: 0.07464806719957277
389
+ name: Cosine Mrr@10
390
+ - type: cosine_map@100
391
+ value: 0.10128193659587485
392
+ name: Cosine Map@100
393
+ - task:
394
+ type: information-retrieval
395
+ name: Information Retrieval
396
+ dataset:
397
+ name: dim 128
398
+ type: dim_128
399
+ metrics:
400
+ - type: cosine_accuracy@1
401
+ value: 0.02462513714494697
402
+ name: Cosine Accuracy@1
403
+ - type: cosine_accuracy@3
404
+ value: 0.0759478239668414
405
+ name: Cosine Accuracy@3
406
+ - type: cosine_accuracy@5
407
+ value: 0.12105327319273436
408
+ name: Cosine Accuracy@5
409
+ - type: cosine_accuracy@10
410
+ value: 0.22199195416311104
411
+ name: Cosine Accuracy@10
412
+ - type: cosine_precision@1
413
+ value: 0.02462513714494697
414
+ name: Cosine Precision@1
415
+ - type: cosine_precision@3
416
+ value: 0.025315941322280464
417
+ name: Cosine Precision@3
418
+ - type: cosine_precision@5
419
+ value: 0.024210654638546873
420
+ name: Cosine Precision@5
421
+ - type: cosine_precision@10
422
+ value: 0.02219919541631111
423
+ name: Cosine Precision@10
424
+ - type: cosine_recall@1
425
+ value: 0.02462513714494697
426
+ name: Cosine Recall@1
427
+ - type: cosine_recall@3
428
+ value: 0.0759478239668414
429
+ name: Cosine Recall@3
430
+ - type: cosine_recall@5
431
+ value: 0.12105327319273436
432
+ name: Cosine Recall@5
433
+ - type: cosine_recall@10
434
+ value: 0.22199195416311104
435
+ name: Cosine Recall@10
436
+ - type: cosine_ndcg@10
437
+ value: 0.1044450851633134
438
+ name: Cosine Ndcg@10
439
+ - type: cosine_mrr@10
440
+ value: 0.06936767229952669
441
+ name: Cosine Mrr@10
442
+ - type: cosine_map@100
443
+ value: 0.09526818860546452
444
+ name: Cosine Map@100
445
+ - task:
446
+ type: information-retrieval
447
+ name: Information Retrieval
448
+ dataset:
449
+ name: dim 64
450
+ type: dim_64
451
+ metrics:
452
+ - type: cosine_accuracy@1
453
+ value: 0.025844203340241376
454
+ name: Cosine Accuracy@1
455
+ - type: cosine_accuracy@3
456
+ value: 0.06948677313178106
457
+ name: Cosine Accuracy@3
458
+ - type: cosine_accuracy@5
459
+ value: 0.1105693039132025
460
+ name: Cosine Accuracy@5
461
+ - type: cosine_accuracy@10
462
+ value: 0.2071193465805193
463
+ name: Cosine Accuracy@10
464
+ - type: cosine_precision@1
465
+ value: 0.025844203340241376
466
+ name: Cosine Precision@1
467
+ - type: cosine_precision@3
468
+ value: 0.023162257710593683
469
+ name: Cosine Precision@3
470
+ - type: cosine_precision@5
471
+ value: 0.022113860782640497
472
+ name: Cosine Precision@5
473
+ - type: cosine_precision@10
474
+ value: 0.02071193465805193
475
+ name: Cosine Precision@10
476
+ - type: cosine_recall@1
477
+ value: 0.025844203340241376
478
+ name: Cosine Recall@1
479
+ - type: cosine_recall@3
480
+ value: 0.06948677313178106
481
+ name: Cosine Recall@3
482
+ - type: cosine_recall@5
483
+ value: 0.1105693039132025
484
+ name: Cosine Recall@5
485
+ - type: cosine_recall@10
486
+ value: 0.2071193465805193
487
+ name: Cosine Recall@10
488
+ - type: cosine_ndcg@10
489
+ value: 0.0984559198907331
490
+ name: Cosine Ndcg@10
491
+ - type: cosine_mrr@10
492
+ value: 0.06610250992184434
493
+ name: Cosine Mrr@10
494
+ - type: cosine_map@100
495
+ value: 0.09035240467186564
496
+ name: Cosine Map@100
497
+ ---
498
+
499
+ # nomic v2 tune
500
+
501
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [nomic-ai/nomic-embed-text-v2-moe](https://huggingface.co/nomic-ai/nomic-embed-text-v2-moe) on the json dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
502
+
503
+ ## Model Details
504
+
505
+ ### Model Description
506
+ - **Model Type:** Sentence Transformer
507
+ - **Base model:** [nomic-ai/nomic-embed-text-v2-moe](https://huggingface.co/nomic-ai/nomic-embed-text-v2-moe) <!-- at revision 45301cc35fd6988724c4698ee0d97981889ef7a0 -->
508
+ - **Maximum Sequence Length:** 512 tokens
509
+ - **Output Dimensionality:** 768 dimensions
510
+ - **Similarity Function:** Cosine Similarity
511
+ - **Training Dataset:**
512
+ - json
513
+ - **Language:** en
514
+ - **License:** apache-2.0
515
+
516
+ ### Model Sources
517
+
518
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
519
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
520
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
521
+
522
+ ### Full Model Architecture
523
+
524
+ ```
525
+ SentenceTransformer(
526
+ (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: NomicBertModel
527
+ (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
528
+ (2): Normalize()
529
+ )
530
+ ```
531
+
532
+ ## Usage
533
+
534
+ ### Direct Usage (Sentence Transformers)
535
+
536
+ First install the Sentence Transformers library:
537
+
538
+ ```bash
539
+ pip install -U sentence-transformers
540
+ ```
541
+
542
+ Then you can load this model and run inference.
543
+ ```python
544
+ from sentence_transformers import SentenceTransformer
545
+
546
+ # Download from the 🤗 Hub
547
+ model = SentenceTransformer("DGSMsRzJ6xC2JthtHG9W/nomic-v2-tuned-1.2")
548
+ # Run inference
549
+ sentences = [
550
+ 'Кто может быть включен в состав ликвидационной комиссии, если участником ликвидируемого общества является государство или муниципальное образование?',
551
+ '1. Общество может быть ликвидировано добровольно в порядке, установленном Гражданским кодексом Российской Федерации , с учетом требований настоящего Федерального закона и устава общества. Общество может быть ликвидировано также по решению суда по основаниям, предусмотренным Гражданским кодексом Российской Федерации . Ликвидация общества влечет за собой его прекращение без перехода прав и обязанностей в порядке правопреемства к другим лицам. 2. Решение общего собран��я участников общества о добровольной ликвидации общества и назначении ликвидационной комиссии принимается по предложению совета директоров (наблюдательного совета) общества, исполнительного органа или участника общества. Общее собрание участников добровольно ликвидируемого общества принимает решение о ликвидации общества и назначении ликвидационной комиссии. (В редакции Федерального закона от 21.03.2002 № 31-ФЗ ) 3. С момента назначения ликвидационной комиссии к ней переходят все полномочия по управлению делами общества. Ликвидационная комиссия от имени ликвидируемого общества выступает в суде. 4. В случае, если участником ликвидируемого общества является Российская Федерация, субъект Российской Федерации или муниципальное образование, в состав ликвидационной комиссии включается представитель федерального органа по управлению государственным имуществом, специализированного учреждения, осуществляющего продажу федерального имущества, органа по управлению государственным имуществом субъекта Российской Федерации, продавца государственного имущества субъекта Российской Федерации или органа местного самоуправления. (В редакции Федерального закона от 21.03.2002 № 31-ФЗ ) 5. Порядок ликвидации общества определяется Гражданским кодексом Российской Федерации и другими федеральными законами.',
552
+ '1. В соответствии с Гражданским кодексом Российской Федерации настоящий Федеральный закон определяет порядок создания, реорганизации, ликвидации, правовое положение акционерных обществ, права и обязанности их акционеров, а также обеспечивает защиту прав и интересов акционеров. (В редакции Федерального закона от 07.08.2001 № 120-ФЗ ) 1.1. (Дополнение пунктом - Федеральный закон от 21.07.2014 № 218-ФЗ ) (Утратил силу - Федеральный закон от 29.06.2015 № 210-ФЗ ) 2. Настоящий Федеральный закон распространяется на все акционерные общества, созданные или создаваемые на территории Российской Федерации, если иное не установлено настоящим Федеральным законом и иными федеральными законами. 3. Особенности создания, реорганизации, ликвидации и правового положения акционерных обществ, являющихся кредитными организациями, страховыми организациями, клиринговыми организациями, специализированными финансовыми обществами, специализированными обществами проектного финансирования, профессиональными участниками рынка ценных бумаг, акционерными инвестиционными фондами, управляющими компаниями инвестиционных фондов, паевых инвестиционных фондов и негосударственных пенсионных фондов, негосударственными пенсионными фондами и иными некредитными финансовыми организациями, акционерными обществами работников (народными предприятиями), а также прав и обязанностей акционеров таких акционерных обществ определяются федеральными законами, регулирующими их деятельность. (В редакции Фед��рального закона от 29.06.2015 № 210-ФЗ )',
553
+ ]
554
+ embeddings = model.encode(sentences)
555
+ print(embeddings.shape)
556
+ # [3, 768]
557
+
558
+ # Get the similarity scores for the embeddings
559
+ similarities = model.similarity(embeddings, embeddings)
560
+ print(similarities.shape)
561
+ # [3, 3]
562
+ ```
563
+
564
+ <!--
565
+ ### Direct Usage (Transformers)
566
+
567
+ <details><summary>Click to see the direct usage in Transformers</summary>
568
+
569
+ </details>
570
+ -->
571
+
572
+ <!--
573
+ ### Downstream Usage (Sentence Transformers)
574
+
575
+ You can finetune this model on your own dataset.
576
+
577
+ <details><summary>Click to expand</summary>
578
+
579
+ </details>
580
+ -->
581
+
582
+ <!--
583
+ ### Out-of-Scope Use
584
+
585
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
586
+ -->
587
+
588
+ ## Evaluation
589
+
590
+ ### Metrics
591
+
592
+ #### Information Retrieval
593
+
594
+ * Datasets: `dim_768`, `dim_512`, `dim_256`, `dim_128` and `dim_64`
595
+ * Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
596
+
597
+ | Metric | dim_768 | dim_512 | dim_256 | dim_128 | dim_64 |
598
+ |:--------------------|:-----------|:-----------|:-----------|:-----------|:-----------|
599
+ | cosine_accuracy@1 | 0.0286 | 0.0274 | 0.0274 | 0.0246 | 0.0258 |
600
+ | cosine_accuracy@3 | 0.0841 | 0.0783 | 0.0807 | 0.0759 | 0.0695 |
601
+ | cosine_accuracy@5 | 0.1332 | 0.1292 | 0.1251 | 0.1211 | 0.1106 |
602
+ | cosine_accuracy@10 | 0.2413 | 0.2389 | 0.2382 | 0.222 | 0.2071 |
603
+ | cosine_precision@1 | 0.0286 | 0.0274 | 0.0274 | 0.0246 | 0.0258 |
604
+ | cosine_precision@3 | 0.028 | 0.0261 | 0.0269 | 0.0253 | 0.0232 |
605
+ | cosine_precision@5 | 0.0266 | 0.0258 | 0.025 | 0.0242 | 0.0221 |
606
+ | cosine_precision@10 | 0.0241 | 0.0239 | 0.0238 | 0.0222 | 0.0207 |
607
+ | cosine_recall@1 | 0.0286 | 0.0274 | 0.0274 | 0.0246 | 0.0258 |
608
+ | cosine_recall@3 | 0.0841 | 0.0783 | 0.0807 | 0.0759 | 0.0695 |
609
+ | cosine_recall@5 | 0.1332 | 0.1292 | 0.1251 | 0.1211 | 0.1106 |
610
+ | cosine_recall@10 | 0.2413 | 0.2389 | 0.2382 | 0.222 | 0.2071 |
611
+ | **cosine_ndcg@10** | **0.1148** | **0.1122** | **0.1121** | **0.1044** | **0.0985** |
612
+ | cosine_mrr@10 | 0.077 | 0.0745 | 0.0746 | 0.0694 | 0.0661 |
613
+ | cosine_map@100 | 0.104 | 0.1014 | 0.1013 | 0.0953 | 0.0904 |
614
+
615
+ <!--
616
+ ## Bias, Risks and Limitations
617
+
618
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
619
+ -->
620
+
621
+ <!--
622
+ ### Recommendations
623
+
624
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
625
+ -->
626
+
627
+ ## Training Details
628
+
629
+ ### Training Dataset
630
+
631
+ #### json
632
+
633
+ * Dataset: json
634
+ * Size: 73,821 training samples
635
+ * Columns: <code>anchor</code> and <code>positive</code>
636
+ * Approximate statistics based on the first 1000 samples:
637
+ | | anchor | positive |
638
+ |:--------|:-----------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
639
+ | type | string | string |
640
+ | details | <ul><li>min: 8 tokens</li><li>mean: 36.69 tokens</li><li>max: 105 tokens</li></ul> | <ul><li>min: 33 tokens</li><li>mean: 251.4 tokens</li><li>max: 443 tokens</li></ul> |
641
+ * Samples:
642
+ | anchor | positive |
643
+ |:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
644
+ | <code>В публичном акционерном обществе совет директоров состоит из 5 человек. Три директора не заинтересованы в сделке и соответствуют требованиям пункта 3 статьи 83. Устав общества устанавливает кворум в 4 человека для проведения заседаний совета директоров. Как будет определена цена имущества в данной ситуации?</code> | <code>Если лицо, заинтересованное в совершении одной или нескольких сделок, при которых цена (денежная оценка) имущества определяется советом директоров (наблюдательным советом) общества, является членом совета директоров (наблюдательного совета) общества, цена (денежная оценка) имущества определяется решением членов совета директоров (наблюдательного совета) общества, не заинтересованных в совершении сделки. В публичном обществе цена (денежная оценка) имущества определяется большинством голосов директоров, не заинтересованных в совершении сделки и соответствующих требованиям, установленным пунктом 3 статьи 83 настоящего Федерального закона, если необходимость большего числа голосов указанных директоров не предусмотрена уставом публичного общества. (В редакции Федерального закона от 03.07.2016 № 343-ФЗ ) В случае, если количество директоров, не заинтересованных в совершении сделки, а в публичном обществе количество директоров, не заинтересованных в совершении сделки и отвечающих требованиям,...</code> |
645
+ | <code>При уменьшении уставного капитала путем передачи ценных бумаг, каждый акционер получает одинаковое количество ценных бумаг одного типа и эмитента, пропорционально уменьшению номинала его акций.</code> | <code>номинальная стоимость акции каждой категории (типа) после ее уменьшения; сумма денежных средств, выплачиваемая акционерам общества при уменьшении номинальной стоимости каждой акции, и (или) количество, вид, категория (тип) эмиссионных ценных бумаг, передаваемых акционерам общества при уменьшении номинальной стоимости каждой акции. Решение об уменьшении уставного капитала общества путем уменьшения номинальной стоимости акций общества принимается общим собранием акционеров общества большинством в три четверти голосов акционеров - владельцев голосующих акций, принимающих участие в общем собрании акционеров общества, только по предложению совета директоров (наблюдательного совета) общества. Решение об уменьшении уставного капитала общества путем уменьшения номинальной стоимости акций общества с передачей акционерам эмиссионных ценных бумаг должно предусматривать передачу каждому акционеру общества эмиссионных ценных бумаг одинаковой категории (типа), которые выпущены одним и тем же эмитент...</code> |
646
+ | <code>В случае, если устав не отнес данное право к компетенции других коллегиальных органов, высший орган формирует и может досрочно прекращать полномочия других органов корпорации.</code> | <code>1. Высшим органом корпорации является общее собрание ее участников. В некоммерческих корпорациях и производственных кооперативах с числом участников более ста высшим органом может являться съезд, конференция или иной представительный (коллегиальный) орган, определяемый их уставами в соответствии с законом. Компетенция этого органа и порядок принятия им решений определяются настоящим Кодексом, другими законами и уставом корпорации. (В редакции Федерального закона от 23.05.2015 № 133-ФЗ ) 2. Если иное не предусмотрено настоящим Кодексом или другим законом, к исключительной компетенции высшего органа корпорации относятся: определение приоритетных направлений деятельности корпорации, принципов образования и использования ее имущества; утверждение и изменение устава корпорации; определение порядка приема в состав участников корпорации и исключения из числа ее участников, кроме случаев, если такой порядок определен законом; образование других органов корпорации и досрочное прекращение их пол...</code> |
647
+ * Loss: [<code>MatryoshkaLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#matryoshkaloss) with these parameters:
648
+ ```json
649
+ {
650
+ "loss": "MultipleNegativesRankingLoss",
651
+ "matryoshka_dims": [
652
+ 768,
653
+ 512,
654
+ 256,
655
+ 128,
656
+ 64
657
+ ],
658
+ "matryoshka_weights": [
659
+ 1,
660
+ 1,
661
+ 1,
662
+ 1,
663
+ 1
664
+ ],
665
+ "n_dims_per_step": -1
666
+ }
667
+ ```
668
+
669
+ ### Training Hyperparameters
670
+ #### Non-Default Hyperparameters
671
+
672
+ - `eval_strategy`: epoch
673
+ - `per_device_train_batch_size`: 32
674
+ - `per_device_eval_batch_size`: 16
675
+ - `gradient_accumulation_steps`: 16
676
+ - `learning_rate`: 2e-05
677
+ - `num_train_epochs`: 4
678
+ - `lr_scheduler_type`: cosine
679
+ - `warmup_ratio`: 0.1
680
+ - `bf16`: True
681
+ - `tf32`: True
682
+ - `load_best_model_at_end`: True
683
+ - `optim`: adamw_torch_fused
684
+ - `batch_sampler`: no_duplicates
685
+
686
+ #### All Hyperparameters
687
+ <details><summary>Click to expand</summary>
688
+
689
+ - `overwrite_output_dir`: False
690
+ - `do_predict`: False
691
+ - `eval_strategy`: epoch
692
+ - `prediction_loss_only`: True
693
+ - `per_device_train_batch_size`: 32
694
+ - `per_device_eval_batch_size`: 16
695
+ - `per_gpu_train_batch_size`: None
696
+ - `per_gpu_eval_batch_size`: None
697
+ - `gradient_accumulation_steps`: 16
698
+ - `eval_accumulation_steps`: None
699
+ - `torch_empty_cache_steps`: None
700
+ - `learning_rate`: 2e-05
701
+ - `weight_decay`: 0.0
702
+ - `adam_beta1`: 0.9
703
+ - `adam_beta2`: 0.999
704
+ - `adam_epsilon`: 1e-08
705
+ - `max_grad_norm`: 1.0
706
+ - `num_train_epochs`: 4
707
+ - `max_steps`: -1
708
+ - `lr_scheduler_type`: cosine
709
+ - `lr_scheduler_kwargs`: {}
710
+ - `warmup_ratio`: 0.1
711
+ - `warmup_steps`: 0
712
+ - `log_level`: passive
713
+ - `log_level_replica`: warning
714
+ - `log_on_each_node`: True
715
+ - `logging_nan_inf_filter`: True
716
+ - `save_safetensors`: True
717
+ - `save_on_each_node`: False
718
+ - `save_only_model`: False
719
+ - `restore_callback_states_from_checkpoint`: False
720
+ - `no_cuda`: False
721
+ - `use_cpu`: False
722
+ - `use_mps_device`: False
723
+ - `seed`: 42
724
+ - `data_seed`: None
725
+ - `jit_mode_eval`: False
726
+ - `use_ipex`: False
727
+ - `bf16`: True
728
+ - `fp16`: False
729
+ - `fp16_opt_level`: O1
730
+ - `half_precision_backend`: auto
731
+ - `bf16_full_eval`: False
732
+ - `fp16_full_eval`: False
733
+ - `tf32`: True
734
+ - `local_rank`: 0
735
+ - `ddp_backend`: None
736
+ - `tpu_num_cores`: None
737
+ - `tpu_metrics_debug`: False
738
+ - `debug`: []
739
+ - `dataloader_drop_last`: False
740
+ - `dataloader_num_workers`: 0
741
+ - `dataloader_prefetch_factor`: None
742
+ - `past_index`: -1
743
+ - `disable_tqdm`: False
744
+ - `remove_unused_columns`: True
745
+ - `label_names`: None
746
+ - `load_best_model_at_end`: True
747
+ - `ignore_data_skip`: False
748
+ - `fsdp`: []
749
+ - `fsdp_min_num_params`: 0
750
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
751
+ - `fsdp_transformer_layer_cls_to_wrap`: None
752
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
753
+ - `deepspeed`: None
754
+ - `label_smoothing_factor`: 0.0
755
+ - `optim`: adamw_torch_fused
756
+ - `optim_args`: None
757
+ - `adafactor`: False
758
+ - `group_by_length`: False
759
+ - `length_column_name`: length
760
+ - `ddp_find_unused_parameters`: None
761
+ - `ddp_bucket_cap_mb`: None
762
+ - `ddp_broadcast_buffers`: False
763
+ - `dataloader_pin_memory`: True
764
+ - `dataloader_persistent_workers`: False
765
+ - `skip_memory_metrics`: True
766
+ - `use_legacy_prediction_loop`: False
767
+ - `push_to_hub`: False
768
+ - `resume_from_checkpoint`: None
769
+ - `hub_model_id`: None
770
+ - `hub_strategy`: every_save
771
+ - `hub_private_repo`: False
772
+ - `hub_always_push`: False
773
+ - `gradient_checkpointing`: False
774
+ - `gradient_checkpointing_kwargs`: None
775
+ - `include_inputs_for_metrics`: False
776
+ - `eval_do_concat_batches`: True
777
+ - `fp16_backend`: auto
778
+ - `push_to_hub_model_id`: None
779
+ - `push_to_hub_organization`: None
780
+ - `mp_parameters`:
781
+ - `auto_find_batch_size`: False
782
+ - `full_determinism`: False
783
+ - `torchdynamo`: None
784
+ - `ray_scope`: last
785
+ - `ddp_timeout`: 1800
786
+ - `torch_compile`: False
787
+ - `torch_compile_backend`: None
788
+ - `torch_compile_mode`: None
789
+ - `dispatch_batches`: None
790
+ - `split_batches`: None
791
+ - `include_tokens_per_second`: False
792
+ - `include_num_input_tokens_seen`: False
793
+ - `neftune_noise_alpha`: None
794
+ - `optim_target_modules`: None
795
+ - `batch_eval_metrics`: False
796
+ - `eval_on_start`: False
797
+ - `eval_use_gather_object`: False
798
+ - `prompts`: None
799
+ - `batch_sampler`: no_duplicates
800
+ - `multi_dataset_batch_sampler`: proportional
801
+
802
+ </details>
803
+
804
+ ### Training Logs
805
+ | Epoch | Step | Training Loss | dim_768_cosine_ndcg@10 | dim_512_cosine_ndcg@10 | dim_256_cosine_ndcg@10 | dim_128_cosine_ndcg@10 | dim_64_cosine_ndcg@10 |
806
+ |:----------:|:-------:|:-------------:|:----------------------:|:----------------------:|:----------------------:|:----------------------:|:---------------------:|
807
+ | 0.0694 | 10 | 2.1039 | - | - | - | - | - |
808
+ | 0.1387 | 20 | 1.7273 | - | - | - | - | - |
809
+ | 0.2081 | 30 | 1.2744 | - | - | - | - | - |
810
+ | 0.2774 | 40 | 1.1445 | - | - | - | - | - |
811
+ | 0.3468 | 50 | 1.009 | - | - | - | - | - |
812
+ | 0.4161 | 60 | 0.8792 | - | - | - | - | - |
813
+ | 0.4855 | 70 | 0.7902 | - | - | - | - | - |
814
+ | 0.5548 | 80 | 0.6764 | - | - | - | - | - |
815
+ | 0.6242 | 90 | 0.7598 | - | - | - | - | - |
816
+ | 0.6935 | 100 | 0.6418 | - | - | - | - | - |
817
+ | 0.7629 | 110 | 0.6186 | - | - | - | - | - |
818
+ | 0.8322 | 120 | 0.6347 | - | - | - | - | - |
819
+ | 0.9016 | 130 | 0.5736 | - | - | - | - | - |
820
+ | 0.9710 | 140 | 0.6096 | - | - | - | - | - |
821
+ | 0.9987 | 144 | - | 0.1060 | 0.1077 | 0.1108 | 0.1032 | 0.0906 |
822
+ | 1.0403 | 150 | 0.5199 | - | - | - | - | - |
823
+ | 1.1097 | 160 | 0.4648 | - | - | - | - | - |
824
+ | 1.1790 | 170 | 0.4245 | - | - | - | - | - |
825
+ | 1.2484 | 180 | 0.4072 | - | - | - | - | - |
826
+ | 1.3177 | 190 | 0.4131 | - | - | - | - | - |
827
+ | 1.3871 | 200 | 0.4521 | - | - | - | - | - |
828
+ | 1.4564 | 210 | 0.418 | - | - | - | - | - |
829
+ | 1.5258 | 220 | 0.3962 | - | - | - | - | - |
830
+ | 1.5951 | 230 | 0.3412 | - | - | - | - | - |
831
+ | 1.6645 | 240 | 0.3968 | - | - | - | - | - |
832
+ | 1.7339 | 250 | 0.3728 | - | - | - | - | - |
833
+ | 1.8032 | 260 | 0.4378 | - | - | - | - | - |
834
+ | 1.8726 | 270 | 0.3821 | - | - | - | - | - |
835
+ | 1.9419 | 280 | 0.3937 | - | - | - | - | - |
836
+ | 1.9974 | 288 | - | 0.1129 | 0.1076 | 0.1092 | 0.1059 | 0.0958 |
837
+ | 2.0113 | 290 | 0.3767 | - | - | - | - | - |
838
+ | 2.0806 | 300 | 0.2859 | - | - | - | - | - |
839
+ | 2.1500 | 310 | 0.2779 | - | - | - | - | - |
840
+ | 2.2193 | 320 | 0.2673 | - | - | - | - | - |
841
+ | 2.2887 | 330 | 0.316 | - | - | - | - | - |
842
+ | 2.3580 | 340 | 0.2528 | - | - | - | - | - |
843
+ | 2.4274 | 350 | 0.2837 | - | - | - | - | - |
844
+ | 2.4967 | 360 | 0.2601 | - | - | - | - | - |
845
+ | 2.5661 | 370 | 0.2976 | - | - | - | - | - |
846
+ | 2.6355 | 380 | 0.2585 | - | - | - | - | - |
847
+ | 2.7048 | 390 | 0.2575 | - | - | - | - | - |
848
+ | 2.7742 | 400 | 0.2766 | - | - | - | - | - |
849
+ | 2.8435 | 410 | 0.2958 | - | - | - | - | - |
850
+ | 2.9129 | 420 | 0.2871 | - | - | - | - | - |
851
+ | 2.9822 | 430 | 0.2974 | - | - | - | - | - |
852
+ | 2.9961 | 432 | - | 0.1141 | 0.1130 | 0.1073 | 0.1060 | 0.0965 |
853
+ | 3.0516 | 440 | 0.2338 | - | - | - | - | - |
854
+ | 3.1209 | 450 | 0.2304 | - | - | - | - | - |
855
+ | 3.1903 | 460 | 0.2144 | - | - | - | - | - |
856
+ | 3.2596 | 470 | 0.2415 | - | - | - | - | - |
857
+ | 3.3290 | 480 | 0.2214 | - | - | - | - | - |
858
+ | 3.3984 | 490 | 0.2388 | - | - | - | - | - |
859
+ | 3.4677 | 500 | 0.2586 | - | - | - | - | - |
860
+ | 3.5371 | 510 | 0.2117 | - | - | - | - | - |
861
+ | 3.6064 | 520 | 0.2262 | - | - | - | - | - |
862
+ | 3.6758 | 530 | 0.1881 | - | - | - | - | - |
863
+ | 3.7451 | 540 | 0.2237 | - | - | - | - | - |
864
+ | 3.8145 | 550 | 0.24 | - | - | - | - | - |
865
+ | 3.8838 | 560 | 0.2319 | - | - | - | - | - |
866
+ | 3.9532 | 570 | 0.226 | - | - | - | - | - |
867
+ | **3.9948** | **576** | **-** | **0.1148** | **0.1122** | **0.1121** | **0.1044** | **0.0985** |
868
+
869
+ * The bold row denotes the saved checkpoint.
870
+
871
+ ### Framework Versions
872
+ - Python: 3.11.11
873
+ - Sentence Transformers: 3.4.1
874
+ - Transformers: 4.43.0
875
+ - PyTorch: 2.6.0+cu124
876
+ - Accelerate: 1.3.0
877
+ - Datasets: 3.3.2
878
+ - Tokenizers: 0.19.1
879
+
880
+ ## Citation
881
+
882
+ ### BibTeX
883
+
884
+ #### Sentence Transformers
885
+ ```bibtex
886
+ @inproceedings{reimers-2019-sentence-bert,
887
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
888
+ author = "Reimers, Nils and Gurevych, Iryna",
889
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
890
+ month = "11",
891
+ year = "2019",
892
+ publisher = "Association for Computational Linguistics",
893
+ url = "https://arxiv.org/abs/1908.10084",
894
+ }
895
+ ```
896
+
897
+ #### MatryoshkaLoss
898
+ ```bibtex
899
+ @misc{kusupati2024matryoshka,
900
+ title={Matryoshka Representation Learning},
901
+ author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
902
+ year={2024},
903
+ eprint={2205.13147},
904
+ archivePrefix={arXiv},
905
+ primaryClass={cs.LG}
906
+ }
907
+ ```
908
+
909
+ #### MultipleNegativesRankingLoss
910
+ ```bibtex
911
+ @misc{henderson2017efficient,
912
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
913
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
914
+ year={2017},
915
+ eprint={1705.00652},
916
+ archivePrefix={arXiv},
917
+ primaryClass={cs.CL}
918
+ }
919
+ ```
920
+
921
+ <!--
922
+ ## Glossary
923
+
924
+ *Clearly define terms in order to be accessible across audiences.*
925
+ -->
926
+
927
+ <!--
928
+ ## Model Card Authors
929
+
930
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
931
+ -->
932
+
933
+ <!--
934
+ ## Model Card Contact
935
+
936
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
937
+ -->
config.json ADDED
@@ -0,0 +1,74 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "nomic-ai/nomic-embed-text-v2-moe",
3
+ "activation_function": "gelu",
4
+ "add_pooling_layer": false,
5
+ "architectures": [
6
+ "NomicBertModel"
7
+ ],
8
+ "attn_pdrop": 0.0,
9
+ "auto_map": {
10
+ "AutoConfig": "nomic-ai/nomic-bert-2048--configuration_hf_nomic_bert.NomicBertConfig",
11
+ "AutoModel": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertModel",
12
+ "AutoModelForMaskedLM": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertForPreTraining",
13
+ "AutoModelForMultipleChoice": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertForMultipleChoice",
14
+ "AutoModelForQuestionAnswering": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertForQuestionAnswering",
15
+ "AutoModelForSequenceClassification": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertForSequenceClassification",
16
+ "AutoModelForTokenClassification": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertForTokenClassification"
17
+ },
18
+ "bos_token_id": null,
19
+ "causal": false,
20
+ "dense_seq_output": true,
21
+ "embd_pdrop": 0.1,
22
+ "eos_token_id": null,
23
+ "expert_choice_router": false,
24
+ "ffn_div": 1,
25
+ "fused_bias_fc": true,
26
+ "fused_dropout_add_ln": true,
27
+ "initializer_range": 0.02,
28
+ "layer_norm_epsilon": 1e-05,
29
+ "max_trained_positions": 2048,
30
+ "mlp_fc1_bias": true,
31
+ "mlp_fc2_bias": true,
32
+ "model_type": "nomic_bert",
33
+ "moe_every_n_layers": 2,
34
+ "moe_impl": "megablocks",
35
+ "moe_normalize_expert_weights": false,
36
+ "moe_resid_pdrop": 0.0,
37
+ "moe_top_k": 2,
38
+ "n_embd": 768,
39
+ "n_head": 12,
40
+ "n_inner": 3072,
41
+ "n_layer": 12,
42
+ "n_positions": 2048,
43
+ "num_experts": 8,
44
+ "num_shared_experts": 0,
45
+ "pad_token_id": 1,
46
+ "pad_vocab_size_multiple": 64,
47
+ "parallel_block": false,
48
+ "parallel_block_tied_norm": false,
49
+ "prenorm": false,
50
+ "qkv_proj_bias": true,
51
+ "reorder_and_upcast_attn": false,
52
+ "resid_pdrop": 0.0,
53
+ "rotary_emb_base": 10000,
54
+ "rotary_emb_fraction": 1.0,
55
+ "rotary_emb_interleaved": false,
56
+ "rotary_emb_scale_base": null,
57
+ "rotary_scaling_factor": null,
58
+ "router_aux_loss_coef": 0.1,
59
+ "scale_attn_by_inverse_layer_idx": false,
60
+ "scale_attn_weights": true,
61
+ "summary_activation": null,
62
+ "summary_first_dropout": 0.1,
63
+ "summary_proj_to_labels": true,
64
+ "summary_type": "cls_index",
65
+ "summary_use_proj": true,
66
+ "torch_dtype": "float32",
67
+ "transformers_version": "4.43.0",
68
+ "type_vocab_size": 1,
69
+ "use_cache": true,
70
+ "use_flash_attn": true,
71
+ "use_rms_norm": null,
72
+ "use_xentropy": true,
73
+ "vocab_size": 250048
74
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.4.1",
4
+ "transformers": "4.43.0",
5
+ "pytorch": "2.6.0+cu124"
6
+ },
7
+ "prompts": {
8
+ "query": "search_query: ",
9
+ "passage": "search_document: ",
10
+ "Classification": "classification: ",
11
+ "MultilabelClassification": "classification: ",
12
+ "Clustering": "clustering: ",
13
+ "PairClassification": "classification: ",
14
+ "STS": "classification: ",
15
+ "Summarization": "classification: ",
16
+ "Speed": "search_document: "
17
+ },
18
+ "default_prompt_name": null,
19
+ "similarity_fn_name": "cosine"
20
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:9cc1eb95134aa1e788fdfaeefc2981e5f1247c398e2dda6e3eb2c0c7085c2d76
3
+ size 1901187232
modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 512,
3
+ "do_lower_case": false
4
+ }
sentencepiece.bpe.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
3
+ size 5069051
special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:883b037111086fd4dfebbbc9b7cee11e1517b5e0c0514879478661440f137085
3
+ size 17082987
tokenizer_config.json ADDED
@@ -0,0 +1,54 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "250001": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": true,
46
+ "cls_token": "<s>",
47
+ "eos_token": "</s>",
48
+ "mask_token": "<mask>",
49
+ "model_max_length": 512,
50
+ "pad_token": "<pad>",
51
+ "sep_token": "</s>",
52
+ "tokenizer_class": "XLMRobertaTokenizer",
53
+ "unk_token": "<unk>"
54
+ }