kardosdrur commited on
Commit
d329398
·
verified ·
1 Parent(s): 0d5c0e7

Upload folder using huggingface_hub

Browse files
Files changed (3) hide show
  1. README.md +76 -0
  2. model.joblib +3 -0
  3. package_versions.json +1 -0
README.md ADDED
@@ -0,0 +1,76 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+
2
+ ---
3
+ pipeline_tag: text-classification
4
+ library_name: turftopic
5
+ tags:
6
+ - turftopic
7
+ - topic-modelling
8
+ ---
9
+
10
+ # kardosdrur/hpv_s3_20
11
+
12
+ This repository contains a topic model trained with the [Turftopic](https://github.com/x-tabdeveloping/turftopic) Python library.
13
+
14
+ To load and use the model run the following piece of code:
15
+
16
+ ```python
17
+ from turftopic import load_model
18
+
19
+ model = load_model(kardosdrur/hpv_s3_20)
20
+ model.print_topics()
21
+ ```
22
+
23
+ ## Model Structure
24
+
25
+ The model is structured as follows:
26
+
27
+ ```
28
+ DynamicS3(decomposition=FastICA(n_components=20, random_state=42),
29
+ encoder=SentenceTransformer(
30
+ (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
31
+ (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
32
+ (2): Normalize()
33
+ ),
34
+ n_components=20, random_state=42,
35
+ vectorizer=CountVectorizer(min_df=10, stop_words='english'))
36
+ ```
37
+
38
+ ## Topics
39
+ The topics discovered by the model are the following:
40
+
41
+ | Topic ID | Highest Ranking | Lowest Ranking |
42
+ | - | - | - |
43
+ | 0 | mundsvælgkræft, mundkræft, mundsvælgskræft, mundhulekræft, halskræft, hovedhalskræft, halskræfthos, halscancer, kræftvirus, kræftvirussen | omkostningseffektiv, omkostningseffektivt, evalueringen, utilfreds, omkostningsundersøgelse, forskningsmidler, forskningsinstitutioner, pilotstudie, forskningsstudier, evaluering |
44
+ | 1 | usikkerhed, kræftvaccination, bekymret, bekymrende, uansvarligt, kræftrisiko, kræftrisikoen, kræftsyg, kræftvaccinationer, bekymringen | forskningsresultat, forskningsresultater, 1992, nobelpris, 1982, 1993, 1994, 1974, 2002, 2012 |
45
+ | 2 | screeningsalderen, age, gennemsnitsalderen, old, gennemsnitsalder, aged, aldersgrænsen, years, årsalderen, aldersgrænse | informationsmøde, informationsmødet, informationskampagne, pressemøde, lokalforening, lokalforeningen, pressemødet, oplysningskampagne, hjemmeside, hjemmesiden |
46
+ | 3 | hovedhalskræft, livsmoderhalskræft, livmoderhalskræften, kræftforskningen, livmoderhalskræftvaccinen, kræftplanen, halskræft, livmorhalskræft, kræftvaccinationer, kræftforskning | kønsvorter, kondomer, kønsvorterne, kondomet, fodvorter, kondom, seksualvaner, sexpartnere, kønsvorter2, seksualpartnere |
47
+ | 4 | ungdommen, forskningsarbejde, forskningssamarbejde, forskerne, pillerne, forskergruppe, forskningsprojekter, myten, journalisterne, personerne | gardasil, gardasils, gardasil9, gradvis, panodil, gradvist, cervarix, greider, gerdes, hertil |
48
+ | 5 | skuespillere, skuespiller, skuespillerinden, skuespilleren, forfattere, direktøren, lykkeligste, underholdning, kritikerne, ældreminister | hpvvirus, hpv, hpvvaccination, hpvvaccine, papillomvirus, hpvvaccineret, vaccine3, hpv16, vaccinehpv, papillovirus |
49
+ | 6 | livmoderhalskræftscreening, screeningsundersøgelse, screeningstest, screeningsundersøgelser, screeningsmetode, screeningsafdeling, screeningsprøve, screeningsmetoder, screening, screeningstilbuddet | kræftvaccinen, kræftvaccine, kræftvacciner, vaccinebivirkninger, kræftvaccination, kræftvaccinationer, truffet, kræften, kræftdødsfald, kræftens |
50
+ | 7 | livmoderhalsen, livmoderhals, livmoderhalskraft, livsmoderhalskræft, livmoderhalsens, livmoder, livmoderhalskræfter, livmoderhalskræftog, livmorhalskræft, livmoderen | drengebørn, drengene, men, drengevaccine, mændene, egenbetaling, regning, drengevenner, drengenes, medicinpriser |
51
+ | 8 | cost, omkostning, omkostninger, kosten, udgiften, udgifter, bekostning, paywall, livmoderhalskræftkoster, royalties | screeningsalderen, ældreminister, aldersgrænse, aldersgrænsen, børneagentur, diagnosetidspunktet, børnelæger, drengebørn, ældreministeriet, børnelæge |
52
+ | 9 | livmoderhalskræftkoster, finanslovsforslaget, finanslovsforhandlingerne, finanslovsudspillet, finansminister, budget, engangsbeløb, cost, bekostning, finansministeriet | vaccinationsforskningen, screeningsundersøgelser, hpv16, hpvvaccinerede, befolkningsundersøgelser, screeningsundersøgelse, undersøgelsen, kræftforskere, vaccinationshistoriens, kræftforsker |
53
+ | 10 | bivirkningsindberetninger, bivirkningskomitéen, bivirkningskomité, hovedpine, bivirkningsramte, bivirkningsramt, smertesymptomer, smertesyndromer, bivirkningerne, symptomerne | kræftforebyggelse, kræftforebyggende, respekt, dækningsgrad, grad, chancer, respekten, dækningsgraden, andel, screeningsalderen |
54
+ | 11 | livmoderhalskræftkoster, underlivskræft, hpvtest, livmoderhalskraeft, livmoderkræfttilfælde, livmoderhalskræfthvert, peniskræft, pigernesresultatet, penishovedet, livmoderhalskræfttilfælde | vaccination, vaccinations, vaccines, vaccinationsskeptiske, mæslingevacciner, mæslingevaccine, vaccineskeptikere, influenzavaccination, vaccine, mæslingevaccinen |
55
+ | 12 | kræftvaccinen, kræftforsker, kræftforskere, kræftvacciner, vaccinationsforskningen, kræftvaccine, kræftforskningen, kræftforskning, kræftvirus, kræftforskeres | interessesammenfaldet, medieomtale, mediedebat, risikoprofil, screeningsalderen, irrelevant, informationsindsats, mediedebatten, fagperson, incitamentsaflønning |
56
+ | 13 | pigernesresultatet, vaccinationsprocenten, vaccinationsprocent, antallet, halveret, deltagerprocenten, 1200, næsthyppigste, resulterede, halvere | rothman, træthedsyndrom, kønsvorter, vortevirus, myelomatose, kønsvorterne, ugens, europas, virussens, anus |
57
+ | 14 | bavarian, nordicbavarian, bavariannordic, bava, bvnry, imvanex, ofnasdaq, nordcan, mva, tavs | gynækologer, gynækolog, gynækologi, sexolog, kønssygdomme, kønssygdom, gynækologen, kønsdele, kønssygdommene, læger |
58
+ | 15 | kræftdødsfald, kræftplanen, kræftplan, kræfthandlingsplan, cancerregistret, cancerregisteret, kræftforekomst, kræftproblemerne, kræftbehandling, kræftrisiko | papillovirus, papillomvirus, hpvvirus, livmoderhalsen, virushpv, hpvvaccinerede, vaccinehpv, hpvinfektion, vaccinenhpv, hpvvaccinen |
59
+ | 16 | kønsvorter, kønsvorte, livmoderhalskræftkoster, kønsvorter2, kønsvorterne, undervurderer, anslår, konkludere, sønner, sønnerne | aldersgrænsen, aldersgrænse, 1995, fødselsårgang, 1975, vaccinationstidspunktet, 1955, sygdomsfri, 1991, 1985 |
60
+ | 17 | proof, hpvtest, bevis, evidence, beviset, bevist, hpvhpv, skepsis, overbevisning, påstå | vaccinationsdeltagelsen, vaccinationsdeltagelse, østdanmark, danmarksmester, vaccinationsdækningen, vaccinationsdækning, vaccinedækning, københavnerne, midtjyllands, københavnsområdet |
61
+ | 18 | kønsvorterne, kønsvorter, kønsvorte, kønsvorter2, vorter, vorte, vorterne, kønsorganerne, kønsorganer, vort | hundredevis, hundredvis, haderslev, herlev, hbv, 24syv, rsv, hrhpv, marselisborg, silkeborg |
62
+ | 19 | højteknologifonden, kampagneekspert, pseudovidenskab, forskningschef, forebyggelseschef, centerdirektør, hpvdebattendebatten, journalisthøjskole, informationskampagne, kommunikationsrådgiver | smertesymptomer, muskelsmerter, symptomerne, migræne, brystsmerter, børneeksem, mavesår, symptomer, bivirkningsramt, symptom |
63
+
64
+ ## Package versions
65
+
66
+ The model in this repo was trained using the following package versions:
67
+
68
+ | Package | Version |
69
+ | - | - |
70
+ | scikit-learn | 1.5.1 |
71
+ | sentence-transformers | 3.3.0 |
72
+ | turftopic | 0.8.1 |
73
+ | joblib | 1.4.2 |
74
+
75
+ We recommend that you install the same, or compatible versions of these packages locally, before trying to load a model.
76
+
model.joblib ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:a52eef9b714f87591e5febbcf787786922f25e8133f3f746cc7bf7d1b9a08c3f
3
+ size 2392602867
package_versions.json ADDED
@@ -0,0 +1 @@
 
 
1
+ {"scikit-learn": "1.5.1", "sentence-transformers": "3.3.0", "turftopic": "0.8.1", "joblib": "1.4.2"}