Home    About me    Publications    Blog    Undergrad memories

Fabio Ruini's blog

'cause Italians blog better

Archivio per la 'Internet and ICT' Categoria

Una rinfrescata al mio sito e statistiche spammatorie

Tempo di pulizie di primavera per il mio sito web, che assolutamente immutato (blog a parte) da diversi mesi a questa parte, iniziava a diventare una legacy a tratti problematica del mio passato. Avendo cambiato lavoro, Paese, ecc… le informazioni (oramai outdated) pubblicate qui dentro avevano infatti iniziato a confondere in maniera un po’ preoccupante alcuni miei interlocutori e di nuovi contatti. Era quindi, decisamente, arrivata l’ora se non di un restyling perlomeno di un corposo aggiornamento.

I cambiamenti hanno per ora riguardato l’home page (rimosso il riferimento alla Plymouth University), la sezione dedicata alle mie pubblicazioni, aggiornata, riveduta e corretta, nonche’ le barre laterali ed il footer del blog (alleggerite entrambe le componenti e risolti alcuni problemi di visualizzazione che si trascinavano da anni). Le prossime modifiche piu’ corpose andranno invece a toccare la pagina About Me, sulla quale ho iniziato a lavorare offline ma che ha ancora bisogno di un po’ di tempo per essere completata.

Visto che ero in vena di smanettamenti ho anche approfittato per cambiare la configurazione del mio hosting Linux ed abbandonare l’ormai decrepito PHP 3 per passare ad una ben piu’ fiammante versione 5.3.22. La quale mi ha a sua volta permesso di aggiornare l’installazione di WordPress (rimasta miracolosamente indenne per oltre un anno di fronte ad una vagonata di vulnerabilita’ facilmente exploitabili), che ora mostra fieramente il numero 3.5.1 alla voce “versione”. Dopo aver aggiornato, insieme a WordPress, anche i suoi vari plugin, l’occhio mi e’ caduto sulla pagina di riepilogo di Akismet, il celebre plugin-antispam, dove la mia attenzione e’ stata catturata da un dato abbastanza curioso. L’immagine qui di seguito mostra infatti il numero di messaggi di spam destinati al mio blog ed intercettati, mese per mese, nel corso dell’ultimo anno. La media di circa 5,000 messaggi di spam mensili (calcolata sul periodo May 2012-Nov 2012 e Feb 2013-May 2013) e’ stata bruscamente oltrepassata tra il dicembre del 2012 ed il gennaio di quest’anno. Circa 50,000 messaggi di spam in due mesi. Piovuti cosi’, dal nulla. Sul web, tramite una ricerca invero piuttosto rapida, non sono riuscito a trovare informazioni particolari e capire cosi’ se il fenomeno fosse stato circoscritto al mio blog o se avesse invece attraversato piu’ trasversalmente la rete. Mi riprometto, tempo permettendo, di indagare un po’.

Screen Shot 2013-05-21 at 1.06.16 AM

Share

Mac Mini (late 2012) e setup con tre monitor

Aggiornamento per la mia postazione di lavoro. Ad affiancare la mia flotta di hardware Apple e’ arrivato oggi (dopo essere rimasto bloccato ieri in quel di Bologna causa sciopero sindacale all’interporto) un fiammante Mac Mini (late 2012), equipaggiato con processore Intel i7 2.6GHz, 16GB di DDR3 a 1,600MHz (reperita tramite eBay con un notevole risparmio rispetto ai prezzi praticati da Apple), e doppio disco rigido (128GB SSD + 1TB HDD) combinato attraverso tecnologia Fusion Drive.

Mac Mini (late 2012)

La cosa piu’ interessante della mia nuova postazione riguarda comunque l’apparato grafico. Fiero possessore da qualche tempo di un triple-head setup (tre display LG W2753VC-PF da 27″, con risoluzione di 1,920×1,080 ciascuno, fino a ieri collegati ad una macchina Windows raramente utilizzata da quando ho chiuso la mia avventura con il poker on line), ho deciso di poter “riciclare” questi monitor per il nuovo Mac. Farlo e’ stato piu’ semplice del previsto. I tre monitor, che per fortuna abbondano in quanto a modalita’ di input, sono stati collegati al Mac in questo modo:

  • Monitor 1: DVI – Thunderbolt
  • Monitor 2: HDMI – HDMI
  • Monitor 3: HDMI – USB

La conversione da DVI a Thunderbolt e’ effettuata per mezzo di un adattatore attivo prodotto dalla Startech (per la precisione questo modello, concepito per le mini DisplayPort in quanto all’epoca ancora non esistevano le Thunderbolt). La conversione HDMI->USB e’ invece affidata ad un piccolo (vedi foto sotto) aggeggio prodotto dalla Club-3D e che risponde al nome di SenseVision CSV-2000H.

Club3D - Sensevision CSV-2000H

Per chi fosse interessato ad una soluzione di questo genere e’ bene sottolineare come le differenze in termini di performance tra il monitor collegato via USB e quelli con connessioni piu’ “tradizionali” sia abbastanza evidente, specie nel momento in cui si trascinano finestre. Con un po’ di accortezza (nel mio caso, per esempio, ho connesso in questo modo il monitor di sinistra, sul quale per abitudine tengo aperti i soli client email e Skype e che non vengono mai mossi) il problema puo’ essere tranquillamente ignorato. Non cosi’, ovviamente, per chi cerca dal proprio setup performance grafiche spinte. Chiudo con una foto (bruttina, ma dovrebbe rendere l’idea) della nuova postazione.

Mac Mini (late 2012) and triple-head (triple monitor) setup

Si’, un giorno daro’ anche una sistemata ai cavi.

Share

Il caso QinetiQ e l’Internet cinese secondo The Economist

E’ di ieri la notizia degli attacchi subiti da QinetiQ, importante azienda di sicurezza basata in UK il cui branch statunitense lavora da anni in svariati progetti commissionati dall’esercito dello zio Sam. Per un periodo di almeno tre anni, dal 2007 al 2010, pare infatti che QinetiQ sia stata sistematicamente svuotata dei contenuti “interessanti” presenti sui propri sistemi informatici. Inclusa, ovviamente, tutta la documentazione piu’ o meno riservata sulla quale la compagnia stava lavorando su commissione del Pentagono. Autori del misfatto, a quanto pare, hacker legati all’apparato militare cinese. In quella che pare solo l’ultima, non in ordine cronologico ma di pubblica divulgazione, delle operazioni di questo genere condotte ai danni di una realta’ industriale occidentale.

La notizia e’ stata riportata con dovizia di dettagli da diverse testate giornalistiche. Tra i vari articoli apparsi on line mi preme segnalare quelli pubblicati da Bloomberg, Techworld ed eWEEK.

Se gli articoli appena citati aiutano ad inquadrare il caso specifico di QinetiQ, ormai da anni esiste un’abbondante letteratura sulle operazioni di hacking attribuite a gruppi cinesi piu’ o meno ufficialmente legati al governo di Pechino. A tal proposito molto interessante lo speciale apparso sul The Economist dello scorso 6 aprile, i cui contenuti sono ora disponibili on line. Per comodita’ li ho raccolti tutti qui di seguito.

Share

Associated Press, Twitter e Wall Street

Piuttosto inquietante quanto accaduto ieri a Wall Street. Verso le 13 ora locale l’indice Dow Jones Industrial Average (secondo Wikipedia, “along with the NASDAQ Composite, the S&P 500 Index, and the Russell 2000 Index, the Dow is among the most closely watched U.S. benchmark indices tracking targeted stock market activity“) e’ crollato di oltre 100 punti (pari a circa l’1%) bruciando diverse centinaia di milioni di dollari di capitalizzazione. Nel giro di sette lunghi, interminabili, minuti l’indice e’ poi riuscito a risalire fino a riassestarsi su valori simili a quelli precedenti il tracollo.

Che cos’e’ successo? La causa e’ tutta tecnologica. Pochi istanti prima del crollo, su Twitter compariva infatti, postato dall’account ufficiale della Associated Press, un tweet secondo il quale due esplosioni avevano colpito la Casa Bianca ferendo il presidente Obama.

Una notizia falsa, inventata di sana pianta. Che pero’, essendo trasmessa da una fonte ritenuta seria ed affidabile, e’ stata sufficiente per mandare immediatamente in tilt in mercati con un pressoche’ istantaneo crollo dei maggiori indici di Wall Street. Successive investigazioni hanno poi portato a ricostruire nei dettagli la vicenda. Molto semplicemente, il controllo dell’account Twitter della AP e’ stato “conquistato” da uno o piu’ individui (responsabilita’ dell’attacco e’ stata assunta dal Syrian Electronic Army, gia’ fautore di precedenti attacchi a testate giornalistiche occidentali) tramite quella che sembra essere stata un’operazione piuttosto classica di phishing. L’account, prima di essere sospeso in via cautelativa, e’ stato utilizzato per postare il messaggio di cui sopra. Causando quegli effetti che appaiono oltremodo evidenti guardando il grafico in apertura di post.

Chi volesse saperne un po’ di piu’ a riguardo puo’ leggere gli articoli pubblicati in merito da Forbes, TechCrunch ed arstechnica.

Share

Mamma ti presento Bo Pang (ovvero di Text Mining, Opinion Mining e Sentiment Analysis)

Il signor Bo Pang, la cui nazionalita’ ignoro, non e’ solo, come recita il titolo riportato sul suo spazio web personale, ricercatore senior a Google che si occupa di Natural Language Processing, Social Media, Web Advertising e Machine Learning. Pang Bo (quale sara’ il nome e quale il cognome e’ una domanda per la quale, nell’istante preciso in cui sto scrivendo queste righe, non conosco la risposta) e’ un personaggio che ha la sana abitudine (che il sottoscritto apprezza e da sempre cerca, nel suo piccolo, di imitare) di condividere con quante piu’ persone possibili i risultati dei suoi lavori. Non solo, prassi comune (ma non troppo) tra chi fa ricerca, condividendo in rete le sue pubblicazioni in barba al vano tentativo di protezione dei diritti operato da parte della rivista scientifica di turno, ma facendo anche uno sforzo aggiuntivo. Ovvero preparando pagine come questa, autentica miniera di informazioni per chi volesse cimentarsi nella sentimento analysis.

La pagina linkata qui sopra costituisce “a distribution site for movie-review data for use in sentiment-analysis experiments. Available are collections of movie-review documents labeled with respect to their overall sentiment polarity (positive or negative) or subjective rating (e.g., “two and a half stars”) and sentences labeled with respect to their subjectivity status (subjective or objective) or polarity.

Oltre 100 pubblicazioni scientifiche hanno utilizzato quei dataset, approssimativamente una decina, per analisi di vario genere. Al di la’ dell’indubbia qualita’ del materiale, e’ infatti piuttosto difficile riuscire a trovare dataset gia’ pronti per poter testare algoritmi di text mining di vario genere.

Ma oltre a fornirci materiale di questo genere, Bo Pang pubblica anche cose piu’ tradizionali. E lo fa pure bene. Tra le sue pubblicazioni piu’ interessanti una monumentale monografia apparsa nel 2008 su Foundations and Trends in Information Retrieval e diversi paper presentati a varie conferenze in giro per il globo. La monografia ed alcuni dei suoi lavori possono essere scaricati anche dai link che seguono. Buona lettura. E grazie ancora a Bo Pang.

Share

Pagina successiva »