cloudyr / MTurkR

R Client for the MTurk Requester API
https://cloud.r-project.org/package=MTurkR
91 stars 18 forks source link

Error in parameters of the Question? #124

Closed anguslockhart closed 7 years ago

anguslockhart commented 7 years ago

Hi all,

I am getting the following error

Error (AWS.MechanicalTurk.InvalidParameterValue):
  The value "<HTMLQuestion xmlns='http://mechanicalturk.amazonaws.com/AWSMechanicalTurkDataSchemas/2011-11-11/HTMLQuestion.xsd'><HTMLContent><![CDATA[<!DOCTYPE html>           
<html>
 <head>
  <meta http-equiv='Content-Type' content='text/html;charset=utf-8'/>
  <title>Example Categorization Task</title>
  <script type='text/javascript' src='https://s3.amazonaws.com/mturk-public/externalHIT_v1.js'></script>
 </head>
 <body>
  <form name='mturk_form' method='post' id='mturk_form' action='https://www.mturk.com/mturk/externalSubmit'>
  <input type='hidden' value='' name='assignmentId' id='assignmentId'/>
  <h1>What is this article about?</h1>
<p>BERLIN. Die Spitzenkandidatin der GrFUNnen, Katrin Goering-Eckardt, hat sich gegen ein generelles Verschleierungsverbot fFUNr Frauen in der oeffentlichkeit ausgesprochen. Sie sei in der DDR aufgewachsen, wo man kein Kreuz in der Schule tragen durfte. Ein Verschleierungsverbot fFUNhre dazu, dass die Frauen nicht mehr auf die Strasse gehen koennten, sondern zu Hause eingesperrt wFUNrden, warnte Goering-Eckardt im Sender â??Radio einsâ??., Zwar koenne man sich vor Gericht oder im Strassenverkehr nicht vollverschleiern, â??aber ansonsten wFUNrde ich lieber mit den Frauen in Kontakt treten, dass sie die Dinger selber abnehmen und auch wissen, dass das hier selbstverstaendlich ist und dass man das darfâ??., â??NatFUNrlich gehoert der Islam zu Deutschlandâ??, Zur Forderung der AfD nach einem Verbot von auslaendisch finanzierten Moscheebauten und der Aussage, der Islam gehoere nicht zu Deutschland, sagte Goering-Eckardt: â??NatFUNrlich gehoert der Islam zu Deutschland, und natFUNrlich gehoe... <truncated>
  <p>What is this article about? Please read it carefully and determine what political issue the article is discussing.</p>
  <p>
    <input type="radio" name="QuestionId1" value="economic" id="q1a" /><label for="q1a">Economic Issues</label><br />
    <input type="radio" name="QuestionId1" value="sociall" id="q1b" /><label for="q1b">Social Issues</label><br />
    <input type="radio" name="QuestionId1" value="foreign" id="q1c" /><label for="q1c">Foreign Policy</label><br />
    <input type="radio" name="QuestionId1" value="character" id="q1d" /><label for="q1d">Issues of Character</label><br />
    <input type="radio" name="QuestionId1" value="something else" id="q1e" /><label for="q1e">Something else</label>
  </p>
  <input type="hidden" name="text" value="BERLIN. Die Spitzenkandidatin der GrFUNnen, Katrin Goering-Eckardt, hat sich gegen ein generelles Verschleierungsverbot fFUNr Frauen in der oeffentlichkeit ausgesprochen. Sie sei in der DDR aufgewachsen, wo man kein Kreuz in der Schule tragen durfte. Ein Verschleierungsverbot fFUNhre dazu, dass die Frauen nicht mehr auf die Strasse gehen koennten, sondern zu Hause eingesperrt wFUNrden, warnte Goering-Eckardt im Sender â??Radio einsâ??., Zwar koenne man sich vor Gericht oder im Strassenverkehr nicht vollverschleiern, â??aber ansonsten wFUNrde ich lieber mit den Frauen in Kontakt treten, dass sie die Dinger selber abnehmen und auch wissen, dass das hier selbstverstaendlich ist und dass man das darfâ??., â??NatFUNrlich gehoert der Islam zu Deutschlandâ??, Zur Forderung der AfD nach einem Verbot von auslaendisch finanzierten Moscheebauten und der Aussage, der Islam gehoere nicht zu Deutschland, sagte Goering-Eckardt: â??NatFUNrlich gehoert der Isla... <truncated>
  <p><input type='submit' id='submitButton' value='Submit' /></p></form>
  <script>turkSetAssignmentID();</script>
 </body>
</html>]]></HTMLContent><FrameHeight>450</FrameHeight></HTMLQuestion>" is not valid for the parameter Question. (1508876851510 s)
Request a5c8be2b-12a7-49d1-822b-7913c668f4bc not valid for API request:
https://mechanicalturk.sandbox.amazonaws.com/?Service = AWSMechanicalTurkRequester
                                             &AWSAccessKeyId = REDACTED
                                             &RequesterAnnotation = Article%20Categorization1%202017-10-24

And I am really unsure why. I'm a bit out of my depths on this one but I suspect it has to do with the encoding and particularly the coding of certain German characters, but no matter how hard I try to remove those nothing seems to be helping. I can provide a small sample of the data if needed.

Angus

anguslockhart commented 7 years ago

Here is the html template I am filling with german articles


<!DOCTYPE html>
--
<html>
<head>
<meta http-equiv='Content-Type'   content='text/html;charset=utf-8'/>
<title>Example Categorization Task</title>
<script type='text/javascript'   src='https://s3.amazonaws.com/mturk-public/externalHIT_v1.js'></script>
</head>
<body>
<form name='mturk_form' method='post' id='mturk_form'   action='https://www.mturk.com/mturk/externalSubmit'>
<input type='hidden' value='' name='assignmentId'   id='assignmentId'/>
<h1>What is this article about?</h1>
<p>${text}</p>
<p>What is this article about? Please read it carefully and   determine what political issue the article is discussing.</p>
<p>
<input type="radio" name="QuestionId1"   value="economic" id="q1a" /><label   for="q1a">Economic Issues</label><br />
<input type="radio" name="QuestionId1"   value="sociall" id="q1b" /><label   for="q1b">Social Issues</label><br />
<input type="radio" name="QuestionId1"   value="foreign" id="q1c" /><label   for="q1c">Foreign Policy</label><br />
<input type="radio" name="QuestionId1"   value="character" id="q1d" /><label   for="q1d">Issues of Character</label><br />
<input type="radio" name="QuestionId1"   value="something else" id="q1e" /><label   for="q1e">Something else</label>
</p>
<p><input type='submit' id='submitButton' value='Submit'   /></p></form>
<script>turkSetAssignmentID();</script>
</body>
</html>
leeper commented 7 years ago

Can you show the R code you're using to create the HIT, as well?

anguslockhart commented 7 years ago

Oh sorry I actually solved this before going to bed last night. It appears that you can't send certain symbols as part of your question. In the error they appear as "â??" but in the actual text I am sending they include "–", "„", " ". If anyone encounters this issue in the future, email me at lockhartg@shaw.ca for a full list of the characters I have found that caused this error.