Upload folder using huggingface_hub
Browse files- README.md +76 -0
- model.joblib +3 -0
- package_versions.json +1 -0
README.md
ADDED
@@ -0,0 +1,76 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
|
2 |
+
---
|
3 |
+
pipeline_tag: text-classification
|
4 |
+
library_name: turftopic
|
5 |
+
tags:
|
6 |
+
- turftopic
|
7 |
+
- topic-modelling
|
8 |
+
---
|
9 |
+
|
10 |
+
# kardosdrur/hpv_s3_20
|
11 |
+
|
12 |
+
This repository contains a topic model trained with the [Turftopic](https://github.com/x-tabdeveloping/turftopic) Python library.
|
13 |
+
|
14 |
+
To load and use the model run the following piece of code:
|
15 |
+
|
16 |
+
```python
|
17 |
+
from turftopic import load_model
|
18 |
+
|
19 |
+
model = load_model(kardosdrur/hpv_s3_20)
|
20 |
+
model.print_topics()
|
21 |
+
```
|
22 |
+
|
23 |
+
## Model Structure
|
24 |
+
|
25 |
+
The model is structured as follows:
|
26 |
+
|
27 |
+
```
|
28 |
+
DynamicS3(decomposition=FastICA(n_components=20, random_state=42),
|
29 |
+
encoder=SentenceTransformer(
|
30 |
+
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
|
31 |
+
(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
|
32 |
+
(2): Normalize()
|
33 |
+
),
|
34 |
+
n_components=20, random_state=42,
|
35 |
+
vectorizer=CountVectorizer(min_df=10, stop_words='english'))
|
36 |
+
```
|
37 |
+
|
38 |
+
## Topics
|
39 |
+
The topics discovered by the model are the following:
|
40 |
+
|
41 |
+
| Topic ID | Highest Ranking | Lowest Ranking |
|
42 |
+
| - | - | - |
|
43 |
+
| 0 | mundsvælgkræft, mundkræft, mundsvælgskræft, mundhulekræft, halskræft, hovedhalskræft, halskræfthos, halscancer, kræftvirus, kræftvirussen | omkostningseffektiv, omkostningseffektivt, evalueringen, utilfreds, omkostningsundersøgelse, forskningsmidler, forskningsinstitutioner, pilotstudie, forskningsstudier, evaluering |
|
44 |
+
| 1 | usikkerhed, kræftvaccination, bekymret, bekymrende, uansvarligt, kræftrisiko, kræftrisikoen, kræftsyg, kræftvaccinationer, bekymringen | forskningsresultat, forskningsresultater, 1992, nobelpris, 1982, 1993, 1994, 1974, 2002, 2012 |
|
45 |
+
| 2 | screeningsalderen, age, gennemsnitsalderen, old, gennemsnitsalder, aged, aldersgrænsen, years, årsalderen, aldersgrænse | informationsmøde, informationsmødet, informationskampagne, pressemøde, lokalforening, lokalforeningen, pressemødet, oplysningskampagne, hjemmeside, hjemmesiden |
|
46 |
+
| 3 | hovedhalskræft, livsmoderhalskræft, livmoderhalskræften, kræftforskningen, livmoderhalskræftvaccinen, kræftplanen, halskræft, livmorhalskræft, kræftvaccinationer, kræftforskning | kønsvorter, kondomer, kønsvorterne, kondomet, fodvorter, kondom, seksualvaner, sexpartnere, kønsvorter2, seksualpartnere |
|
47 |
+
| 4 | ungdommen, forskningsarbejde, forskningssamarbejde, forskerne, pillerne, forskergruppe, forskningsprojekter, myten, journalisterne, personerne | gardasil, gardasils, gardasil9, gradvis, panodil, gradvist, cervarix, greider, gerdes, hertil |
|
48 |
+
| 5 | skuespillere, skuespiller, skuespillerinden, skuespilleren, forfattere, direktøren, lykkeligste, underholdning, kritikerne, ældreminister | hpvvirus, hpv, hpvvaccination, hpvvaccine, papillomvirus, hpvvaccineret, vaccine3, hpv16, vaccinehpv, papillovirus |
|
49 |
+
| 6 | livmoderhalskræftscreening, screeningsundersøgelse, screeningstest, screeningsundersøgelser, screeningsmetode, screeningsafdeling, screeningsprøve, screeningsmetoder, screening, screeningstilbuddet | kræftvaccinen, kræftvaccine, kræftvacciner, vaccinebivirkninger, kræftvaccination, kræftvaccinationer, truffet, kræften, kræftdødsfald, kræftens |
|
50 |
+
| 7 | livmoderhalsen, livmoderhals, livmoderhalskraft, livsmoderhalskræft, livmoderhalsens, livmoder, livmoderhalskræfter, livmoderhalskræftog, livmorhalskræft, livmoderen | drengebørn, drengene, men, drengevaccine, mændene, egenbetaling, regning, drengevenner, drengenes, medicinpriser |
|
51 |
+
| 8 | cost, omkostning, omkostninger, kosten, udgiften, udgifter, bekostning, paywall, livmoderhalskræftkoster, royalties | screeningsalderen, ældreminister, aldersgrænse, aldersgrænsen, børneagentur, diagnosetidspunktet, børnelæger, drengebørn, ældreministeriet, børnelæge |
|
52 |
+
| 9 | livmoderhalskræftkoster, finanslovsforslaget, finanslovsforhandlingerne, finanslovsudspillet, finansminister, budget, engangsbeløb, cost, bekostning, finansministeriet | vaccinationsforskningen, screeningsundersøgelser, hpv16, hpvvaccinerede, befolkningsundersøgelser, screeningsundersøgelse, undersøgelsen, kræftforskere, vaccinationshistoriens, kræftforsker |
|
53 |
+
| 10 | bivirkningsindberetninger, bivirkningskomitéen, bivirkningskomité, hovedpine, bivirkningsramte, bivirkningsramt, smertesymptomer, smertesyndromer, bivirkningerne, symptomerne | kræftforebyggelse, kræftforebyggende, respekt, dækningsgrad, grad, chancer, respekten, dækningsgraden, andel, screeningsalderen |
|
54 |
+
| 11 | livmoderhalskræftkoster, underlivskræft, hpvtest, livmoderhalskraeft, livmoderkræfttilfælde, livmoderhalskræfthvert, peniskræft, pigernesresultatet, penishovedet, livmoderhalskræfttilfælde | vaccination, vaccinations, vaccines, vaccinationsskeptiske, mæslingevacciner, mæslingevaccine, vaccineskeptikere, influenzavaccination, vaccine, mæslingevaccinen |
|
55 |
+
| 12 | kræftvaccinen, kræftforsker, kræftforskere, kræftvacciner, vaccinationsforskningen, kræftvaccine, kræftforskningen, kræftforskning, kræftvirus, kræftforskeres | interessesammenfaldet, medieomtale, mediedebat, risikoprofil, screeningsalderen, irrelevant, informationsindsats, mediedebatten, fagperson, incitamentsaflønning |
|
56 |
+
| 13 | pigernesresultatet, vaccinationsprocenten, vaccinationsprocent, antallet, halveret, deltagerprocenten, 1200, næsthyppigste, resulterede, halvere | rothman, træthedsyndrom, kønsvorter, vortevirus, myelomatose, kønsvorterne, ugens, europas, virussens, anus |
|
57 |
+
| 14 | bavarian, nordicbavarian, bavariannordic, bava, bvnry, imvanex, ofnasdaq, nordcan, mva, tavs | gynækologer, gynækolog, gynækologi, sexolog, kønssygdomme, kønssygdom, gynækologen, kønsdele, kønssygdommene, læger |
|
58 |
+
| 15 | kræftdødsfald, kræftplanen, kræftplan, kræfthandlingsplan, cancerregistret, cancerregisteret, kræftforekomst, kræftproblemerne, kræftbehandling, kræftrisiko | papillovirus, papillomvirus, hpvvirus, livmoderhalsen, virushpv, hpvvaccinerede, vaccinehpv, hpvinfektion, vaccinenhpv, hpvvaccinen |
|
59 |
+
| 16 | kønsvorter, kønsvorte, livmoderhalskræftkoster, kønsvorter2, kønsvorterne, undervurderer, anslår, konkludere, sønner, sønnerne | aldersgrænsen, aldersgrænse, 1995, fødselsårgang, 1975, vaccinationstidspunktet, 1955, sygdomsfri, 1991, 1985 |
|
60 |
+
| 17 | proof, hpvtest, bevis, evidence, beviset, bevist, hpvhpv, skepsis, overbevisning, påstå | vaccinationsdeltagelsen, vaccinationsdeltagelse, østdanmark, danmarksmester, vaccinationsdækningen, vaccinationsdækning, vaccinedækning, københavnerne, midtjyllands, københavnsområdet |
|
61 |
+
| 18 | kønsvorterne, kønsvorter, kønsvorte, kønsvorter2, vorter, vorte, vorterne, kønsorganerne, kønsorganer, vort | hundredevis, hundredvis, haderslev, herlev, hbv, 24syv, rsv, hrhpv, marselisborg, silkeborg |
|
62 |
+
| 19 | højteknologifonden, kampagneekspert, pseudovidenskab, forskningschef, forebyggelseschef, centerdirektør, hpvdebattendebatten, journalisthøjskole, informationskampagne, kommunikationsrådgiver | smertesymptomer, muskelsmerter, symptomerne, migræne, brystsmerter, børneeksem, mavesår, symptomer, bivirkningsramt, symptom |
|
63 |
+
|
64 |
+
## Package versions
|
65 |
+
|
66 |
+
The model in this repo was trained using the following package versions:
|
67 |
+
|
68 |
+
| Package | Version |
|
69 |
+
| - | - |
|
70 |
+
| scikit-learn | 1.5.1 |
|
71 |
+
| sentence-transformers | 3.3.0 |
|
72 |
+
| turftopic | 0.8.1 |
|
73 |
+
| joblib | 1.4.2 |
|
74 |
+
|
75 |
+
We recommend that you install the same, or compatible versions of these packages locally, before trying to load a model.
|
76 |
+
|
model.joblib
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:a52eef9b714f87591e5febbcf787786922f25e8133f3f746cc7bf7d1b9a08c3f
|
3 |
+
size 2392602867
|
package_versions.json
ADDED
@@ -0,0 +1 @@
|
|
|
|
|
1 |
+
{"scikit-learn": "1.5.1", "sentence-transformers": "3.3.0", "turftopic": "0.8.1", "joblib": "1.4.2"}
|