-
Notifications
You must be signed in to change notification settings - Fork 2
/
Copy pathindex.js
234 lines (215 loc) · 6.29 KB
/
index.js
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
const fs = require("fs");
const reader = require("readline-sync");
const path = require("path");
const fetch = require("node-fetch");
const jsdom = require("jsdom");
const { exit } = require("process");
const { JSDOM } = jsdom;
// Lista statica, un po' inutile adesso ma chissa' magari serve
const DIPARTIMENTI = [
"da",
"beniculturali",
"chimica",
"chimica-industriale",
"dar",
"fabit",
"ficlit",
"dfc",
"fisica-astronomia",
"disi",
"dicam",
"dei",
"ingegneriaindustriale",
"dit",
"lingue",
"matematica",
"dimes",
"psicologia",
"scienzeaziendali",
"bigea",
"dibinem",
"edu",
"distal",
"dse",
"dsg",
"dimec",
"scienzemedicheveterinarie",
"scienzequalitavita",
"dsps",
"stat",
// "sde", e' particolare questo
"disci",
];
const DIPARTIMENTI_URL =
"https://www.unibo.it/it/ateneo/sedi-e-strutture/dipartimenti";
const LISTA_DOCENTI_URL =
"https://{{dip}}.unibo.it/it/dipartimento/persone/docenti-e-ricercatori?pagenumber=1&pagesize=100000000&order=asc&sort=Cognome&";
const TAB_TESI_SUFFIX = "/didattica?tab=tesi";
const FILE_NAME = "tesi.md";
const DIR_NAME = "tesi";
function printWarn(str) {
console.log(`[!] ${str}`);
}
function printLog(str) {
console.log(`[-] ${str}`);
}
function printError(str) {
console.log(`[x] ${str}`);
}
function getTesiURL(base) {
return base + TAB_TESI_SUFFIX;
}
// !!! sde ha la pagina per i docenti diversa , da evitare
async function getDipartimenti() {
try {
let res = await fetch(DIPARTIMENTI_URL);
let source = await res.text();
const dom = new JSDOM(source).window.document;
let text = dom.querySelector(".description-text");
let links = text.querySelectorAll("a");
let dipartimenti = [];
for (let i = 0; i < links.length; i++) {
let url = links[i].href;
let codice = /http[s]:\/\/(.*?)\.unibo/gm.exec(url)[1].toLowerCase();
let nome = links[i].textContent;
dipartimenti.push({ nome, codice, url });
}
return dipartimenti;
} catch (e) {
throw e;
}
}
async function getTesi(docente_url) {
try {
let url = getTesiURL(docente_url);
let res = await fetch(url);
let source = await res.text();
const dom = new JSDOM(source).window.document;
let tesi = [
{ nome: "Tesi proposte", tesi: [] },
{ nome: "Tesi assegnate", tesi: [] },
];
let proposte = dom.querySelector(".inner-text");
if (proposte) {
let text = proposte.innerHTML.trim();
if (text != "") tesi[0].tesi.push({ titolo: "Tutte", tesi: [text] });
}
let liste = dom.querySelectorAll(".report-list");
for (let i = 0; i < liste.length; i++) {
let titolo = liste[i].querySelector("h4").textContent;
let tipo = { titolo, tesi: [] };
let lista_tesi = liste[i].querySelectorAll("li");
for (let j = 0; j < lista_tesi.length; j++) {
let _t = lista_tesi[j].textContent.trim();
tipo.tesi.push(_t);
}
tesi[1].tesi.push(tipo);
}
return tesi;
} catch (e) {
throw e;
}
}
async function getDocenti(dip) {
try {
let res = await fetch(LISTA_DOCENTI_URL.replace("{{dip}}", dip.codice));
let source = await res.text();
const dom = new JSDOM(source).window.document;
let cards_list = dom.querySelector(".picture-cards");
let cards = cards_list.querySelectorAll(".item");
let docenti = [];
for (let i = 0; i < cards.length; i++) {
let nome = cards[i].querySelector("a").textContent.trim();
let url = cards[i].querySelector("a").href;
let ruolo = cards[i].querySelector("p").textContent.trim();
let tesi = await getTesi(url);
let docente = { nome, url, ruolo, tesi };
docenti.push(docente);
}
return docenti;
} catch (e) {
throw e;
}
}
async function generateMarkDown(dip, docenti) {
let s = `## Tesi ${dip.nome}\n`;
for (let i = 0; i < docenti.length; i++) {
s += `#### ${docenti[i].nome}\n###### ${docenti[i].ruolo}\n[Sito Web](${docenti[i].url})\n`;
for (let j = 0; j < docenti[i].tesi.length; j++) {
s += ` * ${docenti[i].tesi[j].nome}\n`;
let tesi = docenti[i].tesi[j].tesi;
for (let k = 0; k < tesi.length; k++) {
s += ` - ${tesi[k].titolo}\n`;
for (let l = 0; l < tesi[k].tesi.length; l++) {
tesi[k].tesi[l] = tesi[k].tesi[l].replace(/\n/gm, "");
s += ` + ${tesi[k].tesi[l]}\n`;
}
}
}
s += "\n";
}
return s;
}
async function saveMarkDown(dip, md) {
let p = path.join(
__dirname,
path.join(DIR_NAME, `${dip.codice}_${FILE_NAME}`)
);
fs.writeFileSync(p, md);
return p;
}
function mostraListaDipartimenti(dipartimenti) {
printLog(
"Questa e' la lista dei dipartimenti da cui pui scegliere!\n Inserire il campo `Codice`!"
);
for (let i = 0; i < dipartimenti.length; i++) {
printLog(
`Nome :\n\t${dipartimenti[i].nome}"\n Codice :\n\t${dipartimenti[i].codice}`
);
}
}
async function scaricaPerDipartimento(dipartimento) {
try {
printLog(`Raccolgo docenti e tesi da\n\t\t${dipartimento.nome}`);
let docenti = await getDocenti(dipartimento);
printLog("Genero il file markdown");
let md = await generateMarkDown(dipartimento, docenti);
let p = await saveMarkDown(dipartimento, md);
printLog(`File generato in \n\t${p}`);
} catch (e) {
throw e;
}
}
async function test() {
let dipartimenti = await getDipartimenti();
for (let i = 0; i < dipartimenti.length; i++) {
let dip = dipartimenti[i];
scaricaPerDipartimento(dip);
}
}
async function main() {
try {
printLog(
"Per info sulle sigle guardare qua -> \n\thttps://www.unibo.it/it/ateneo/sedi-e-strutture/dipartimenti"
);
printWarn(
"Guardare il dominio del dipartimanto non il codice\n\tEsempio.\n\t\tDIFA -> fisica-astronomia\n\t\tCHIMIND -> chimica-industriale"
);
printLog("Raccolgo tutti i dipartimenti");
let dipartimenti = await getDipartimenti();
let dip = reader.question("[?] Sigla dipartimento : ");
let index = -1;
for (let i = 0; i < dipartimenti.length; i++)
if (dipartimenti[i].codice === dip) index = i;
if (index === -1) {
printError("Dipartimento non trovato");
mostraListaDipartimenti(dipartimenti);
return;
}
scaricaPerDipartimento(dipartimenti[index]);
} catch (e) {
printError("Qualcosa e' andato storto :(");
}
}
main();
// test();