cnmoro
/

static-nomic-eng-ptbr

Feature Extraction

Model card Files Files and versions Community

This Model2Vec model was created by using Tokenlearn, with nomic-embed-text-v2-moe as a base, trained on around 3.5M passages (english and portuguese).

I have yet to run any benchmarks on it, but it easily outperforms potion-multilingual-128M on my custom-portuguese-testing-workload-thing.

The output dimension is 512.

Usage

Load this model using the from_pretrained method:

from model2vec import StaticModel

# Load a pretrained Model2Vec model
model = StaticModel.from_pretrained("cnmoro/static-nomic-eng-ptbr")

# Compute text embeddings
embeddings = model.encode(["Example sentence"])

Downloads last month: 3

Safetensors

Model size

128M params

Tensor type

F32

·

Inference Providers NEW

Feature Extraction

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for cnmoro/static-nomic-eng-ptbr

Base model

FacebookAI/xlm-roberta-base

Finetuned

nomic-ai/nomic-xlm-2048

Finetuned

nomic-ai/nomic-embed-text-v2-moe-unsupervised

Finetuned

nomic-ai/nomic-embed-text-v2-moe

Finetuned

(16)

this model

Datasets used to train cnmoro/static-nomic-eng-ptbr

Collection including cnmoro/static-nomic-eng-ptbr

Embedding Models

Some embedding models I've trained, finetuned, distilled, converted, or something else entirely • 14 items • Updated 2 days ago