özniteliğinden BeatifulSoup ile href ayıklanıyor

oy
2

Bu yöntemi kullanmak

allcity = dom.body.findAll(attrs={'id' : re.compile(\d{1,2})})

Böyle bir liste dönmek için:

[<a onmousedown=return c({'fm':'as','F':'77B717EA','F1':'9D73F1E4','F2':'4CA6DE6B','F3':'54E5243F','T':'1279189248','title':this.innerHTML,'url':this.href,'p1':1,'y':'B2D76EFF'}) href=http://www.ylyd.com/showurl.asp?id=6182 target=_blank><font size=3>掳虏驴碌路驴碌脴虏煤脨脜脧垄脥酶 隆煤 脢脦脝路脦露脕卢陆脫</font></a>, 
<a href=http://cache.baidu.com/c?m=9f65cb4a8c8507ed4fece763105392230e54f728629c86027fa3c215cc791a1b1a23a4fb7935107380843e7000db120afdf14076340920a3de95c81cd2ace52f38fb5023716c914b19c46ea8dc4755d650e34d99aa0ee6cae74596b9a1d6c85523dd58716df7f49c5b7003c065e76445&amp;p=8b2a9403c0934eaf5abfc8385864&amp;user=baidu target=_blank class=m>掳脵露脠驴矛脮脮</a>]

Bunu nasıl href ayıklamak?

http://www.ylyd.com/showurl.asp?id=6182

Teşekkürler. :)

Oluştur 15/07/2010 saat 09:06
kaynak kullanıcı
Diğer dillerde...                            


1 cevaplar

oy
0

kullanabilirsiniz

for a in dom.body.findAll(attrs={'id' : re.compile("\d{1,2}")}, href=True):
   a['href']
Cevap 02/09/2011 saat 12:44
kaynak kullanıcı

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more