Some changes in order to allow the refactoring of functions to work from within the appEngine.

2025-12-06 08:52:55 +01:00 · 2010-11-12 21:28:25 -06:00 · 2010-11-12 21:28:25 -06:00 · c77498e6ea
commit c77498e6ea
parent 99ba1b48aa
5 changed files with 32 additions and 34 deletions
--- a/adapter.py
+++ b/adapter.py
@ -3,6 +3,11 @@
 import logging
 import datetime
 try:
 	from google.appengine.api.urlfetch import fetch as googlefetch
 	appEngineGlob = True
 except:
 	appEngineGlob = False
 class LoginRequiredException(Exception):
 	def __init__(self, url):
@ -12,11 +17,7 @@ class LoginRequiredException(Exception):
 		return repr(self.url + ' requires user to be logged in')
 class FanfictionSiteAdapter:
-	try:
+	appEngine = appEngineGlob
 		from google.appengine.api.urlfetch import fetch as googlefetch
 		appEngine = True
 	except:
 		appEngine = False
 	login = ''
 	password = ''
 	url = ''
@ -30,6 +31,7 @@ class FanfictionSiteAdapter:
 	authorURL = ''
 	outputStorySep = '-Ukn_'
 	outputName = ''
 	outputFileName = ''
 	storyDescription = ''
 	storyCharacters = []
 	storySeries = ''
@ -57,6 +59,12 @@ class FanfictionSiteAdapter:
 	def hasAppEngine(self):
 		return self.appEngine
 	def fetchUrl(self, url):
 		if not self.appEngine:
 			return self.opener.open(url).read().decode('utf-8')
 		else:
 			return googlefetch(url).content
 	def requiresLogin(self, url = None):
 		return False
@ -86,9 +94,14 @@ class FanfictionSiteAdapter:
 	def getOutputName(self):
 		self.outputName = self.storyName.replace(" ", "_") + self.outputStorySep + self.storyId
-		logging.debug('self.storyId=%s, self.storyName=%s self.outputName=%s' % (self.storyId, self.storyName, self.outputName))
+		logging.debug('self.outputName=%s' % self.outputName)
 		return self.outputName
 	def getOutputFileName(self, booksDirectory, format):
 		self.outputFileName = booksDirectory + "/" + self.getOutputName() + "." + format
 		logging.debug('self.outputFileName=%s' % self.outputFileName)
 		return self.outputNameFileName
 	def getAuthorURL(self):
 		logging.debug('self.authorURL=%s' % self.authorURL)
 		return self.authorURL
--- a/downloader.py
+++ b/downloader.py
@ -55,7 +55,10 @@ class FanficLoader:
 		urls = self.adapter.extractIndividualUrls()
-		s = self.booksDirectory + "/" + self.adapter.getOutputName() + "." + format
+		if (self.adapter.hasAppEngine):
 			self.overWrite = True
 		else:
 			s = self.adapter.getOutputFileName(self.booksDirectory, format)
 			if not self.overWrite and os.path.isfile(s):
 				print >> sys.stderr, "File " + s + " already exists!  Skipping!"
 				exit(10)
--- a/ffnet.py
+++ b/ffnet.py
@ -143,14 +143,8 @@ class FFNet(FanfictionSiteAdapter):
 				self.addSubject(subj)
 		return True
 	def _fetchUrl(self, url):
 		if not self.appEngine:
 			return self.opener.open(url).read().decode('utf-8')
 		else:
 			return googlefetch(url).content
 	def extractIndividualUrls(self):
-		data = self._fetchUrl(self.url)
+		data = self.fetchUrl(self.url)
 		d2 = re.sub('&\#[0-9]+;', ' ', data)
 		soup = bs.BeautifulStoneSoup(d2)
 		allA = soup.findAll('a')
@ -264,7 +258,7 @@ class FFNet(FanfictionSiteAdapter):
 	def getText(self, url):
 		time.sleep( 2.0 )
-		data = self._fetchUrl(url)
+		data = self.fetchUrl(url)
 		lines = data.split('\n')
 		textbuf = ''
--- a/fpcom.py
+++ b/fpcom.py
@ -137,14 +137,8 @@ class FPCom(FanfictionSiteAdapter):
 				self.addSubject(subj)
 		return True
 	def _fetchUrl(self, url):
 		if not self.appEngine:
 			return self.opener.open(url).read().decode('utf-8')
 		else:
 			return googlefetch(url).content
 	def extractIndividualUrls(self):
-		data = self._fetchUrl(self.url)
+		data = self.fetchUrl(self.url)
 		d2 = re.sub('&\#[0-9]+;', ' ', data)
 		soup = bs.BeautifulStoneSoup(d2)
 		allA = soup.findAll('a')
@ -283,7 +277,7 @@ class FPCom(FanfictionSiteAdapter):
 	def getText(self, url):
 		time.sleep( 2.0 )
-		data = self._fetchUrl(url)
+		data = self.fetchUrl(url)
 		lines = data.split('\n')
 		textbuf = ''
--- a/mediaminer.py
+++ b/mediaminer.py
@ -143,14 +143,8 @@ class MediaMiner(FanfictionSiteAdapter):
 				self.addSubject(subj)
 		return True
 	def _fetchUrl(self, url):
 		if not self.appEngine:
 			return self.opener.open(url).read().decode('utf-8')
 		else:
 			return googlefetch(url).content
 	def extractIndividualUrls(self):
-		data = self._fetchUrl(self.url)
+		data = self.fetchUrl(self.url)
 		#data.replace('<br />',' ').replace('<br>',' ').replace('</br>',' ')
 		soup = bs.BeautifulSoup(data)
 		#logging.debug('soap=%s' % soup)
@ -318,7 +312,7 @@ class MediaMiner(FanfictionSiteAdapter):
 	def getText(self, url):
 		time.sleep( 2.0 )
 		logging.debug('url=%s' % url)
-		data = self._fetchUrl(url)
+		data = self.fetchUrl(url)
 		try:
 			soup = bs.BeautifulSoup(data)