Update README.md
Browse files
README.md
CHANGED
|
@@ -13,6 +13,7 @@ tags:
|
|
| 13 |
- ruby
|
| 14 |
- rust
|
| 15 |
- go
|
|
|
|
| 16 |
base_model: Shuu12121/CodeModernBERT-Crow
|
| 17 |
pipeline_tag: sentence-similarity
|
| 18 |
library_name: sentence-transformers
|
|
@@ -27,17 +28,18 @@ datasets:
|
|
| 27 |
language:
|
| 28 |
- en
|
| 29 |
widget:
|
| 30 |
-
|
| 31 |
-
-
|
| 32 |
-
|
| 33 |
-
|
| 34 |
-
|
| 35 |
-
|
| 36 |
-
|
| 37 |
-
|
| 38 |
-
|
| 39 |
-
|
| 40 |
-
|
|
|
|
| 41 |
---
|
| 42 |
|
| 43 |
# Shuu12121/CodeSearch-ModernBERT-Crow-Plus🐦⬛
|
|
@@ -50,6 +52,20 @@ This is a Sentence Transformer model based on `Shuu12121/CodeModernBERT-Crow`, f
|
|
| 50 |
ベースモデル (Base Model): [Shuu12121/CodeModernBERT-Crow](https://huggingface.co/Shuu12121/CodeModernBERT-Crow)
|
| 51 |
License: Apache-2.0
|
| 52 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 53 |
## 概要 / Overview
|
| 54 |
|
| 55 |
`CodeSearch-ModernBERT-Crow-Plus` は、自然言語のクエリと複数のプログラミング言語(Python, Java, JavaScript, PHP, Ruby, Go, Rust)のコードスニペット(主に関数レベル)間の意味的な類似性を捉えるために設計された Sentence Transformer モデルです。ベースモデルである `CodeModernBERT-Crow` の強力なコード理解能力を継承し、コード検索や類似性判定タスクに最適化されています。
|
|
|
|
| 13 |
- ruby
|
| 14 |
- rust
|
| 15 |
- go
|
| 16 |
+
- mteb
|
| 17 |
base_model: Shuu12121/CodeModernBERT-Crow
|
| 18 |
pipeline_tag: sentence-similarity
|
| 19 |
library_name: sentence-transformers
|
|
|
|
| 28 |
language:
|
| 29 |
- en
|
| 30 |
widget:
|
| 31 |
+
- src_texts:
|
| 32 |
+
- 'def greet(name): print(f''Hello, {name}!'')'
|
| 33 |
+
- function calculateSum(a, b) { return a + b; }
|
| 34 |
+
- >-
|
| 35 |
+
public static void main(String[] args) { System.out.println("Hello World");
|
| 36 |
+
}
|
| 37 |
+
example_title: Code Snippets
|
| 38 |
+
- src_texts:
|
| 39 |
+
- A function that prints a greeting.
|
| 40 |
+
- Function to compute the sum of two numbers.
|
| 41 |
+
- The main entry point of a Java program.
|
| 42 |
+
example_title: Descriptions
|
| 43 |
---
|
| 44 |
|
| 45 |
# Shuu12121/CodeSearch-ModernBERT-Crow-Plus🐦⬛
|
|
|
|
| 52 |
ベースモデル (Base Model): [Shuu12121/CodeModernBERT-Crow](https://huggingface.co/Shuu12121/CodeModernBERT-Crow)
|
| 53 |
License: Apache-2.0
|
| 54 |
|
| 55 |
+
## 📊 MTEB Leaderboard 成績
|
| 56 |
+
|
| 57 |
+
本モデル `CodeSearch-ModernBERT-Crow-Plus` は、Massive Text Embedding Benchmark (MTEB) における以下のタスクで高い順位を記録しています:
|
| 58 |
+
|
| 59 |
+
| タスク名 | nDCG@10 スコア | 順位(2025年4月時点) |
|
| 60 |
+
|-------------------------------|----------------|----------------------------|
|
| 61 |
+
| CodeSearchNetRetrieval | **0.89296** | **第8位 / 146 モデル中** |
|
| 62 |
+
| COIRCodeSearchNetRetrieval | **0.79884** | **第5位 / 15 モデル中** |
|
| 63 |
+
|
| 64 |
+
これらの結果は、本モデルがコード検索タスクにおいて非常に競争力のある性能を発揮していることを示しています。
|
| 65 |
+
特に、**多言語・自然言語–コード間の検索精度**に優れた Sentence Transformer モデルとして、実用的な選択肢の一つです。
|
| 66 |
+
|
| 67 |
+
|
| 68 |
+
|
| 69 |
## 概要 / Overview
|
| 70 |
|
| 71 |
`CodeSearch-ModernBERT-Crow-Plus` は、自然言語のクエリと複数のプログラミング言語(Python, Java, JavaScript, PHP, Ruby, Go, Rust)のコードスニペット(主に関数レベル)間の意味的な類似性を捉えるために設計された Sentence Transformer モデルです。ベースモデルである `CodeModernBERT-Crow` の強力なコード理解能力を継承し、コード検索や類似性判定タスクに最適化されています。
|