Add exception for bad HTML breaking img finding.

2025-12-31 13:14:57 +01:00 · 2016-03-28 12:05:37 -05:00 · 2016-03-28 12:05:37 -05:00 · be0d48ec7b
commit be0d48ec7b
parent cf54f274d4
1 changed files with 8 additions and 5 deletions
--- a/fanficfare/adapters/base_adapter.py
+++ b/fanficfare/adapters/base_adapter.py
@ -571,11 +571,14 @@ class BaseSiteAdapter(Configurable):
        #print("include_images:"+self.getConfig('include_images'))
        if self.getConfig('include_images'):
            acceptable_attributes.extend(('src','alt','longdesc'))
-            for img in soup.findAll('img'):
-                # some pre-existing epubs have img tags that had src stripped off.
-                if img.has_attr('src'):
-                    (img['src'],img['longdesc'])=self.story.addImgUrl(url,img['src'],fetch,
-                                                                      coverexclusion=self.getConfig('cover_exclusion_regexp'))
+            try:
+                for img in soup.find_all('img'):
+                    # some pre-existing epubs have img tags that had src stripped off.
+                    if img.has_attr('src'):
+                        (img['src'],img['longdesc'])=self.story.addImgUrl(url,img['src'],fetch,
+                                                                          coverexclusion=self.getConfig('cover_exclusion_regexp'))
+            except AttributeError as ae:
+                logger.info("Parsing for img tags failed--probably poor input HTML.  Skipping images.")

        for attr in self.get_attr_keys(soup):
            if attr not in acceptable_attributes: