sizin düzeni ile ilgili bir problem herhangi tekrarlanan satırları tekrarlanan bir karma olurdu olmasıdır; Eğer bu çizgilerin biri eklenen veya silinen zamanı belirtmek asla
Çok iyi bir nokta, ama bir sorun değil. Tekrarlanan çizgi yineleniyor ve tüm çiftleri işleme sonraki aşamada silinir. Yani evet haklısınız, ama bu bir sorun değildir.
"Fark" bağlantısı bana bir uygulamadır ne varsayalım ilgili açıklamaların yer aldığı bir sayfaya götürür? Hiçbir indirme linki burada ne eksik ... herhangi bir dilde kod bulunmadığından vardır?
Bazılarınız bayt seviyesi tanesellik bahsettik. Bu gerekli değildir. Sadece hat düzeyinde ayrıntı hattında şey değişmiştir eğer hat içinde herhangi bir değişiklik bütün çizgi etkiler yapmamı, tüm hat (kayıt) yeniden işlenmesi gerekir çünkü gereklidir.
Bu yüzden her Yaklaşık 1m hatlarıdır iki dosyaları (bugünün enstantane ve dün anlık) 'de yaklaşık 1000 karakter (hayır ikili), satırları karşılaştırıyorsunuz.
Yani SHA256 gibi güvenli karma (MD5 çarpışma vardır ve karşılaştırma yavaş) benim HO dizüstü 30MB / sn yaklaşık işleyebilir kullanarak. Tabii sunucu çok daha hızlı içinden çiğneyecektir.
Dosya zıplarlar 1GB ise, o zaman bütün HASE'lerin yapma konusunda 33sec alır ve pencereler sayfa belleği kullanarak 1Gb dosya okumaya yaklaşık 30 saniye sürer. korkunç değil
Şimdi her dosyada satırları temsil eden hashs iki diziler var. Onları sıralama yaparsanız, şimdi bir ikili arama kullanabilirsiniz, bu yüzden eski dosyaları hashs bir maç için arayan yeni dosyalar hashs yolumuzu yineleme. Bunu bulana yok, o satır değişiklikleri dosyaya eklenir.
çizgilerin kitabı (eski veritabanı) her açıdan bilinmemektedir unutmayın. çizgilerin, değişikliklerin konumu, bu tür değişikliklere düzenin garantisi yoktur.
sayfası tarafından foreward sayfayı okuma önerileri iyidir, ama iki dosya ilk değişim kadar e kadar SMAE sırayla olduğunu varsayar. Bu kabul edilemez. hatlar (satır), herhangi bir sırayla olabilir. Ayrıca hattın taneciklik keyfi bir blok boyu aykırıdır seçmek. Bu görevin amaçları doğrultusunda, çizgiler değişken değildir.
invrementa yükleme o mükemmel bağlantısından: Karşılaştırma Yakalama Dosya: Bu yöntem aynı zamanda anlık diferansiyel yöntemi olarak bilinir. Bu yöntem daha önce tutarak ve veri deposuna ilgilendiren dosyaların görüntüleri sonrasında çalışır. Kayıtlar değişiklikleri bulmak için karşılaştırılır ve kayıt tuşları ekler ve siler bulmak için karşılaştırılır. Bu teknik sayesinde genelde mevcut ve işlem günlükleri varolmayan veya özel bir biçimde ya vardır yok tetikler gerçeğine eski sistemlerden durumunda en uygundur. En eski veritabanları dosyalarına veri damping için bazı mekanizmalar olduğundan, bu teknik periyodik anlık oluşturur ve ardından değişim kayıtları üretmek sonuçlarla karşılaştırır. Kuşkusuz, statik yakalama tüm sorunlar burada mevcuttur. Eklenen karmaşıklığı bilgilerinin tamamı satırları karşılaştırarak meydan tarafından anahtar tanıma ve eşleştirme ile tanıtıldı. Bu teknik, bazı durumlarda, tek çözüm olabilir, doğada karmaşık ve tipik olarak istenen bir durum değildir ancak.
Bu burada en alakalı: Biz terabayt veri ambarlarının dünyasına devam ederken, bir gece olarak sıfırdan veri ambarı yeniden yeteneği dinozor yol gidecek. Veri ambarı güncellenmesi için mantıklı ve verimli bir yaklaşım artan güncelleme stratejisi çeşit gerektirir.
Bu yüzden ben o zaman doğru yolda olduğumu tahmin? Bir btree endeksi bir avantaj göze olmaz?