Sonucun meydana geldiği zaman serileri için istatistiksel test - python

oy
0

Regresyon testi ile ilgili yardım soruyorum. Pozitif ve negatif tamsayılar arasında dalgalanan sürekli bir zaman serim var. Ayrıca bu zaman serisinde rastgele görünen zaman noktalarında meydana gelen olaylar da var. Esasen, bir olay meydana geldiğinde ilgili tamsayıyı yakalarım. Daha sonra bu tamsayının olayı etkileyip etkilemediğini test etmek istiyorum. İçinde olduğu gibi, daha pozitif / negatif tamsayılar var mı?

Başlangıçta pozitif / negatif sayı ile lojistik gerilemeyi düşündüm, ancak bu en az iki ayrı grup gerektiriyordu. Halbuki sadece meydana gelen olaylar hakkında bilgi sahibiyim. Biraz sürekli ve rastgele olduğu için gerçekleşmeyen olayları gerçekten ekleyemiyorum. Bir olayın gerçekleşmediği miktarı ölçmek imkansızdır.

Bu yüzden farklı grubum bir anlamda doğrudur, çünkü gerçekleşmeyen bir şeyden herhangi bir sonuç almadım. Ne sınıflandırmaya çalışıyorum:

Bir sonuç ortaya çıktığında, pozitif veya negatif tam sayı bu sonucu etkiler .

Oluştur 11/05/2020 saat 04:28
kaynak kullanıcı
Diğer dillerde...                            


3 cevaplar

oy
0

Bununla birlikte, sorunun ilk paragraftan sonra anlaşılması oldukça zordur. Bu sorudan anlayabileceğim şeylerden yardım edeyim.

Var olan olaylar ile verilerdeki tamsayılar arasında bir ilişki olup olmadığını anlamak istediğinizi varsayarsak.

1. yaklaşım: Verileri 2 boyutlu bir ölçekte çizin ve veriler arasında bir ilişki olup olmadığını görsel olarak kontrol edin. 2. yaklaşım: olaylardan gelen verileri sürekli hale getirin ve olayları diğer verilerden kaldırın ve hareketli pencereyi kullanarak verileri düzleştirin ve ardından her iki eğilimi karşılaştırın.

Yukarıda verilen yaklaşım sadece sorununuzu doğru anladığımda iyi sonuç verir. Survivorship önyargısı olarak bilinen bir şey daha var. Verileriniz eksik olabilir, lütfen bu bölümü de kontrol edin.

Cevap 18/05/2020 saat 13:52
kaynak kullanıcı

oy
0

Belirli bir veri akışı üreten temel kuvvetleri belirlemeye ilgi duyduğunuz anlaşılıyor. Bu matematiksel modellere Markov Modelleri denir. Klasik bir örnek, metin çalışmasıdır.

Örneğin, İngilizce metnin bir paragrafında bir Gizli Markov Modeli algoritması çalıştırırsam, paragrafta hangi harflerin görünme olasılığını belirleyen iki sürüş kategorisi olduğunu göreceğim. Bu kategoriler kabaca iki gruba ayrılabilir: "aeiouy" ve "bcdfghjklmnpqrstvwxz". Ne matematik ne de HMM bu kategorilere ne diyeceğini “biliyordu”, ancak bunlar bir metin paragrafının analizine istatistiksel olarak dönüştürülmüş olanlardır. Bu kategorilere "ünlüler" ve "ünsüzler" diyebiliriz. Yani, evet, ünlüler ve ünsüzler sadece öğrenilecek 1. sınıf kategoriler değildir, metnin istatistiksel olarak nasıl yazıldığını takip ederler. İlginç bir şekilde, bir "uzay" bir ünsüzden ziyade bir sesli harf gibi davranır. Yukarıdaki örnek için olasılıkları vermedim, ancak "y" nin kabaca 0.6 sesli ve 0.4 ünsüz olasılığı ile sonuçlandığını belirtmek ilginçtir; yani "y" istatistiksel olarak en ünsüz davranan ünlüdür.

Harika bir makale https://www.cs.sjsu.edu/~stamp/RUA/HMM.pdf'dir ve bu tür zaman serisi analizlerinin temel fikirlerini aşar ve hatta referans için bazı sudo kodu sağlar.

Karşılaştığınız veriler hakkında fazla bir şey bilmiyorum ve "pozitif" ve "negatif" kavramlarının gördüğünüz verilerde belirleyici bir faktör olup olmadığını bilmiyorum, ancak ve iki grubun pozitif sayıların toplanması ve negatif sayıların toplanması olduğunu tespit ederseniz, cevabınız doğrulanacaktır, evet, verilerinizi yönlendiren en etkili iki kategori pozitif ve negatif kavramlarıdır. Eşit şekilde bölünmezlerse, cevabınız bu kavramların veriyi yönlendirmede etkili bir faktör olmadığıdır. Daha da ötesi, algoritma, verilerinizdeki her tamsayının her bir kategoriden ne kadar etkilendiğini gösteren birkaç olasılık matrisiyle sona erer, bu nedenle zaman serisi verilerinizin davranışı hakkında daha fazla bilgi sahibi olursunuz.

Cevap 19/05/2020 saat 07:59
kaynak kullanıcı

oy
0

Belki probleminizi yanlış anlıyorum ama daha fazla bilgi olmadan her türlü anlamlı regresyonu yapabileceğinize inanmıyorum.

Regresyon genellikle iki veya daha fazla değişken arasında bir ilişki bulmak için kullanılır, ancak yalnızca bir değişkeniniz (pozitif veya negatif ise) ve bir sabitin (sonuç her zaman verilerde doğrudur) olduğu görülür. Belki sayıların dağılımı (ortalama, medyan, standart sapma) hakkında bazı istatistikler yapabilirsiniz, ancak regresyonu nasıl yapabileceğinizden emin değilim. https://en.wikipedia.org/wiki/Regression_analysis

Verilerinizin büyük bir bölümünü kaçırırsanız, hayatta kalma konusunda bazı güçlü yanlılıklar olabileceğini düşünmek isteyebilirsiniz. https://en.wikipedia.org/wiki/Survivorship_bias

Umarım bu sizi doğru yöne yönlendirmek için en azından biraz yardımcı olur

Cevap 11/05/2020 saat 04:53
kaynak kullanıcı

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more