Top PDF Profil épidémiologique et clinique du cancer du sein chez la femme au CHU Mohammed VI de Marrakech

Classificazione delle serie storiche: alcune analisi

Classificazione delle serie storiche: alcune analisi

In questo lavoro si vuole effettuare Cluster Analysis nell’ambito delle serie storiche. Con Cluster Analysis, detta anche analisi dei grappoli, si intende il processo che suddivide un insieme generico di osservazioni in gruppi di osser- vazioni simili. Tali metodi sono stati sviluppati fin dalla fine del XIX secolo e si valuta che gli algoritmi elaborati fino ad oggi siano circa un migliaio. L’uso della Cluster Analysis pone problemi relativi alla scelta di una metri- ca che sia in grado di esprimere sinteticamente la distanza tra gli elementi del campione che si vogliono raggruppare. Nello specifico contesto dei da- ti temporali, il concetto di somiglianza ` e particolarmente complesso date le caratteristiche dinamiche della serie. Le misure di somiglianze generalmente considerate nella analisi di cluster per dati indipendenti non funzionano in maniera adeguata con dati che hanno una dipendenza temporale perch´ e igno- rano le relazioni di interdipendenza tra i valori. ` E opportuno quindi usare delle misure di distanza che tengano conto del comportamento della serie nel tempo.
More...

Read more

Il valore del cliente: analisi di classificazione con dati  longitudinali

Il valore del cliente: analisi di classificazione con dati longitudinali

La variabile di classificazione scelta è il customer value, ossia una misura che valuta la redditività mensile di ciascun utente. La variabile è ricavata dal data-set aziendale, che racchiude un’insieme di informazioni per un campione di 32.524 utenti. Per ognuno di essi sono disponibili alcune variabili di natura anagrafica e 5 serie storiche relative ai consumi telefonici per il periodo che va da novembre 2004 a marzo 2006. Da quest’ultimo mese è stata ottenuta la variabile di classificazione, moltiplicando i consumi mensili totali di ogni cliente per il costo in euro degli stessi. In un primo momento si suppone che questo dato sia ignoto, in modo da stimarlo con metodi di classificazione, per poi verificare se la suddivisione ottenuta si avvicina a quella nota. Vengono stimati più modelli previsivi, costruiti combinando gli strumenti dell’analisi di classificazione con lo studio delle serie storiche.
More...

Read more

Riconciliazione di sistemi di serie storiche economiche

Riconciliazione di sistemi di serie storiche economiche

Le statistiche economiche sono spesso collegate da un sistema di relazioni contabili. Alcune restrizioni lineari sono originate dalla teoria economica (per esempio, il pro- dotto interno lordo come saldo tra impieghi e risorse), altre sono dovute al livello di disaggregazione col quale sono fornite le statistiche (per esempio il valore aggiunto ƉĞƌů͛ĞĐŽŶŽŵŝĂƚŽƚĂůĞ͕ĐŝŽğƉĞƌŝůĐŽŵƉůĞƐƐŽĚŝƵŶŝƚăŽƐĞƚƚŽƌŝŝƐƚŝƚƵnjŝŽŶĂůŝ͕ğůĂƐŽm- ma dei valori aggiunti delle 21 macrobranche di attività economica previste dalla classificazione NACE). In ogni caso, questi vincoli sono raramente soddisfatti dai dati raccolti: questo accade perché, ad esempio, i dati economici sono raccolti con me- todi diversi, da campioni diversi, elaborati con tecniche diverse ed infine pubblicati per scopi diversi. Quindi i valori ottenuti presentano delle discrepanze rispetto ai vincoli che dovrebbero soddisfare; tali discrepanze creano confusione tra gli utenti e imbarazzo ai produttori dei dati.
More...

Read more

Il possesso di attività finanziarie degli Italiani. Alcune analisi

Il possesso di attività finanziarie degli Italiani. Alcune analisi

Le stime dei modelli a risposta binaria hanno portato a conclusioni molto interessanti dal punto di vista della corretta classificazione dei dati; si è riusciti dunque, attraverso le variabili utilizzate a discriminare tra potenziali investitori e non. Diversamente, i modelli finalizzati a descrivere le relazioni tra le variabili e il rispettivo ammontare investito nelle varie attività finanziarie, descrivono poco del fenomeno, probabilmente troppo complesso e che necessiterebbe l’inclusione di ulteriori fattori. Emerge chiaramente un filo conduttore in questo lavoro, e cioè l’importanza del reddito: questa variabile risulta essere la più determinante in riferimento a tutti gli aspetti analizzati e ci mostra come una forte disponibilità di risorse permette di investire e con somme di una certa entità. In particolare è la sola caratteristica che influisce sul possesso e sulle quantità investite nelle gestioni patrimoniali.
More...

Read more

Analisi del ruolo delle variabili climatiche nei flussi di CO2 tra ecosistemi e atmosfera tramite modelli empirici e serie storiche di misure eddy covariance

Analisi del ruolo delle variabili climatiche nei flussi di CO2 tra ecosistemi e atmosfera tramite modelli empirici e serie storiche di misure eddy covariance

Per ogni dataset di lunghezza diversa sono state create 120 reti (ovvero sei architetture diverse, per ogni architettura sono state addestrate 20 reti, come descritto nel paragrafo2.5) per i metodi DM e FM, e 100 alberi di decisione per il metodo RM. I risultati sulla classificazione dell’importanza delle variabili sono stati confrontati attraverso l’indice di Spearman come illustrato in Figura 4 (Random Forest - RM), Figura 5 (Destruction of Order - DM ) e Figura 6 (Forward stepwise method – FM). Il coefficiente di correlazione di Spearman assume i valori tra – 1 e + 1 indicando nel segno e nel valore il tipo e la forza della correlazione. Il segno + indica una correlazione direttamente proporzionale, il segno – indica una correlazione inversamente proporzionale. Valori di rho vicini ad 1 indicano una correlazione perfetta, il valore rho = o molto vicino a 0 indica una correlazione nulla.
More...

Read more

Data mining per serie storiche

Data mining per serie storiche

Nel caso in cui i dati siano linearmente separabili si può effettuare una classificazione lineare in cui si assume che esista almeno un iperpiano in grado di separare i campioni dell’insieme di addestramento di classe -1 da quelli di classe 1. L’obiettivo è quello di trovare l’iperpiano che separa nel modo migliore l’insieme dei campioni, cioè l’iperpiano che rende massimo il margine (μ), il quale rappresenta la distanza minima fra le due classi. Si noti quindi che per l’apprendimento sono importanti solo gli esempi più vicini all’iperpiano e questi vengono chiamati vettori di supporto (supports vectors).
More...

Read more

La proprietà di reversibilità nelle serie storiche

La proprietà di reversibilità nelle serie storiche

Ci sono molti esempi di modelli statistici comunemente usati per processi stocastici discreti che sono reversibili nel tempo, inclusa la successione di variabili casuali IID (indipendenti e identica- mente distribuite) e il caso di processo stazionario gaussiano. Un processo lineare non gaussiano, in generale è irreversibile rispetto al tempo, tranne quando i suoi coefficienti soddisfano alcune con- dizioni molto restrittive. Se si riesce a capire se la serie storica ha un comportamento reversibile o non reversibile, per trovare il modello migliore, si può ricercare il modello in una classe molto più piccola; ad esempio, se la serie storica è reversibile si cerca il processo generatore dei dati nell’insieme dei processi reversibili, escludendo tutti gli altri. Non sorprende quindi che il test per la reversibilità sia importante per costruire il modello nell’analisi delle serie temporali. Sono stati suggeriti diversi test per la re- versibilità temporale da applicare come test per la specifica del modello; un test per la reversibilità temporale può essere usato prima dell’assunzione di un modello lineare gaussiano, oppure pri- ma di tentare una trasformazione dei punti in un modello lineare gaussiano.
More...

Read more

Analisi degli effetti degli investimenti pubblicitari sulle vendite di carburanti con modelli per serie storiche

Analisi degli effetti degli investimenti pubblicitari sulle vendite di carburanti con modelli per serie storiche

I modelli a funzione di trasferimento mettono in relazione una singola serie di dati (output) ad una o più serie di input. Per esempio le vendite possono essere influenzate dalle spese in pubblicità; il consumo giornaliero di elettricità può dipendere da alcune variabili come la temperatura massima raggiunta all’esterno o il grado di umidità. Nel caso proposto, i volumi venduti e le quote di mercato rappresentano le serie di output, mentre gli investimenti, i prezzi e gli individui sono gli input. Per comprendere a fondo le successive analisi è bene spiegare per sommi capi cos’è una funzione di trasferimento e quali sono le sue caratteristiche (per ulteriori dettagli si veda Wei W. W. S., Time
More...

Read more

Il realized range: proprieta dinamiche e previsione della  volatilita' di serie storiche finanziarie

Il realized range: proprieta dinamiche e previsione della volatilita' di serie storiche finanziarie

Se invece proviamo a modificare la funzione di densità otteniamo il valore più alto della funzione di log-verosimiglianza per il modello 2.8 in cui viene utilizzata la distribuzione GED per la stima di massima verosimiglianza dei parametri; e che prevede una specificazione HAR per la media del processo in cui inseriamo le variabili esogene e le esogene in forma HAR; e una specificazione GARCH per il momento secondo della serie, che dipende a sua volta dall’esponenziale delle esogene. Nell’equazione della media diventa significativo l’indice Standard & Poors 1500 (SP) e la componente settimanale dello stesso indice, la componente settimanale e mensile del tasso di interesse a breve termine (RB) e la componente mensile del tasso di cambio Euro/Dollaro (EU).
More...

Read more

Analisi delle espressioni geniche per la classificazione di diversi tipi di leucemia

Analisi delle espressioni geniche per la classificazione di diversi tipi di leucemia

I problemi sopra menzionati riguardano l’ambito statistico, ma esistono diverse questioni derivanti dal contesto biologico e dall’importanza dei risultati in campo medico. Una questione riguarda la corrispondenza tra rilevanza biologica e statistica di uno stesso gene come classificatore: la rilevanza biologica è un criterio da tenere in forte considerazione in quanto ogni informazione rilevata durante l’analisi può essere utile per la scoperta delle funzioni specifiche di un certo gene, per la determinazione di gruppi di geni che concorrono allo sviluppo di cellule o tessuti cancerogeni, per la scoperta di interazione tra i geni o per altri studi biologici come l’individuazione di geni marcatori. Infine esiste una questione chiamata contaminazione del campione: usualmente tessuti normali e cancerogeni sono composti da cellule differenti, il tessuto tumorale è ricco di cellule epitali mentre il tessuto normale è formato da una grossa porzione di cellule muscolari. Questo può condurre ad una selezione di geni che hanno diversi valori di espressione nei due tessuti, ma tale differenza è imputabile ad una diversa composizione dei tessuti stessi con il risultato di una buona regola di classificazione ma senza fornire risultati biologici rilevanti.
More...

Read more

Analisi statistica di alcune variabili della mobilità internazionale

Analisi statistica di alcune variabili della mobilità internazionale

Secondo un approccio preliminare l’utilizzo dei posti verrà osservato nel complesso. In altre parole, si analizzerà la percentuale di utilizzo per anno accademico e per facoltà nella globalità degli anni. Infatti i posti pubblicizzati nel bando Erasmus sono divisi per facoltà. In altre parole, ogni facoltà dispone di una serie limitata di destinazioni per i propri studenti: è possibile vedere quindi quale delle facoltà utilizza meglio i posti a disposizione.

Read more

Modellazione e previsione di serie storiche delle vendite:  il caso Dab Pumps S.P.A

Modellazione e previsione di serie storiche delle vendite: il caso Dab Pumps S.P.A

Per le serie storiche di natura economica è utile considerare i modelli ARMAX (AutoRegressive Moving Average with eXogenous variable). Il modello ARMAX è un raffinamento di un ARMA in quanto riduce la varianza dell’ARMA con l’introduzione nel modello di una o più variabili esogene. Questo accade per il motivo che le variabili esterne contengono informazioni aggiuntive rispetto al “passato” della serie in grado di contribuire nella spiegazione della variabilità del modello.

Read more

Destagionalizzazione delle serie storiche della produzione e del fatturato provinciale. Il caso dell'industria manifatturiera vicentina

Destagionalizzazione delle serie storiche della produzione e del fatturato provinciale. Il caso dell'industria manifatturiera vicentina

/D&DPHUDGL&RPPHUFLR /D &DPHUD GL &RPPHUFLR q XQ HQWH SXEEOLFR GRWDWR GL DXWRQRPLD IXQ]LRQDOH FKH VYROJH QHOO·DPELWR GHOOD FLUFRVFUL]LRQH WHUULWRULDOH GL FRPSHWHQ]D VXOOD EDVH GHO SULQF[r]

Read more

Analisi di serie temporali delle concentrazioni polliniche

Analisi di serie temporali delle concentrazioni polliniche

La parte di modellazione dei dati è iniziata col cercare le possibili variabili che maggiormente influenzano la concentrazione pollinica; a tal fine si è svolto un incontro il 28 Maggio coinvolgendo più professionisti ARPAV. Mostrando le analisi ottenute è emersa una probabile relazione tra le somme termiche e il ciclo fenologico della pianta, ne segue perciò la possibile suddivisione del Veneto in 2 zone.

Read more

Neet e lavoratori scoraggiati: alcune analisi

Neet e lavoratori scoraggiati: alcune analisi

I dati ribadiscono quanto questa fascia di età abbia delle dinamiche che si discostano anche di molto dalla popolazione presa nel suo insieme. Se si escludono gli anni pre-crisi 2008, infatti, i valori risultano inferiori al 45% per quanto riguarda il tasso di attività (laddove il valore minimo, seppur trimestrale, registrato nella fascia 15 anni e più era oltre il 47%), e ben superiori al 15% per quel che concerne il tasso di disoccupazione (sempre sotto al 14%, a livello trimestrale, per le persone di 15 anni e più), con tre osservazioni che si attestano addirittura intorno al 30% circa. Si nota anche in questo caso, per quanto riguarda la serie del tasso di disoccupazione, un trend leggermente decrescente a partire dal 2014. Sono numeri impossibili da ignorare, e che, piuttosto inevitabilmente, sono spesso citati dai media e accolti dall’opinione pubblica con una certa preoccupazione (la situazione è ancora più desolante andando a considerare il tasso di disoccupazione giovanile, calcolato per le persone di età 15-24 anni). È in questo contesto che si inseriscono i NEET. In primo luogo, è doveroso fornire anche in questo caso dei dati che permettano di mettere a fuoco il fenomeno di cui si sta discutendo.
More...

Read more

Incidenti stradali a Padova: alcune analisi

Incidenti stradali a Padova: alcune analisi

circolazione derivante dalla mobilità sistematica dovuta agli spostamenti casa-ufficio e casa-scuola; il secondo picco si osserva tra le ore 12 e 13 in corrispondenza dell’uscita dalle scuole ed in relazione alla mobilità di alcune categorie (professionisti, commercianti ecc) che usufruiscono dell’orario spezzato; infine il picco più elevato di incidentalità si registra intorno alle ore 18, quando si cumulano gli effetti dell’incremento della circolazione dovuto agli spostamenti dal luogo del lavoro versol’abitazione con fattori psico-sociali quali lo stress da lavoro, la difficoltà di percezione visiva dovuta alla riduzione della luce naturale non ancora sostituita da quella artificiale.
More...

Read more

Serie

Serie

52.6 Determinare se si tratta di una serie di potenze ed in caso affermativo indicarne i coefficienti 52.7 Studiare la convergenza uni- forme della serie al variare di a, b 52.8 Indicare se esistono a, b per i quali la serie non converge puntualmente per nessun valore di x reale. 52.9 Esprimere, nel caso in cui la serie sia convergente, la sua somma in termini di funzioni elementari

Read more

Analisi di serie temporali sui livelli potenziometrici nel Bacino Termale Euganeo

Analisi di serie temporali sui livelli potenziometrici nel Bacino Termale Euganeo

Cap. 2 Analisi preliminari e dati mancanti…………………………….... >> 11 2.1. Fonte e descrizione dei dati …...…...…...…...…...…...…….. >> 11 2.2. Procedure per il completamento della serie: il LOESS …..…. >> 14 2.3. Applicazione alla serie di Abano Terme ………...………….. >> 18 2.4. Applicazione alla serie di Montegrotto ..……………………. >> 25 2.5. Scelta tra le due procedure e della serie finale ………… ….. >> 30

Read more

SERIE NUMERICHE

SERIE NUMERICHE

E’ importante osservare che l’implicazione contenuta in questo teorema non si inverte nel senso che una serie convergente non e’ tenuta ad essere anche assolutamente convergente. Ad es[r]

Read more

Serie di Fourier

Serie di Fourier

RICHIAMI SULLA SERIE DI FOURIER.[r]

Read more

Show all 10000 documents...

Related subjects