dragnet-org / dragnet

Just the facts -- web page content extraction
MIT License
1.25k stars 180 forks source link

BlockifyError when getting main content #16

Closed slitayem closed 9 years ago

slitayem commented 9 years ago

Hi, I am getting BlockifyError

     90
     91         blocks = self._blockifier.blockify(s, encoding=encoding,
---> 92             parse_callback=parse_callback)
     93
     94         # doc needs to be at least three blocks, otherwise return everything

dragnet/blocks.pyx in dragnet.blocks.TagCountNoCSSReadabilityBlockifier.blockify (dragnet/blocks.cpp:8879)()

dragnet/blocks.pyx in dragnet.blocks.Blockifier.blockify (dragnet/blocks.cpp:7963)()

BlockifyError:

when trying to get main content of the following html page with content_extractor.analyze

<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE HTML PUBLIC "-//WAPFORUM//DTD XHTML Mobile 1.2//EN" "http://www.openmobilealliance.org/tech/DTD/xhtml-mobile12.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="de-DE" dir="ltr">

<head>
    <!-- data-info:v:2.0.5542.29760;a:23125861-6957-4cdf-8ac3-9a2eb03636d1;cn:140;az:{did:e4542eb382cf47daa0d27ce0fde0622d, rid: 140, sn: neurope-hp, dt: 2015-03-06T07:50:13.1753311Z, bt: O};ddpi:1;dpio:;dpi:1;dg:downlevel.pc;th:start;PageName:startPage;m:de-de;cb:;l:de-de;mu:de-de;ud:{cid:,vk:homepage,n:,l:de-de,ck:};xd:AA7TmFi;ovc:f;fxd:t;xdpub:2015-03-10 00:56:48Z;xdmap:2015-03-10 01:53:27Z;axd:;f: -->

    <link rel="canonical" href="http://www.msn.com/de-de/" />

        <title>MSN Deutschland – mit Hotmail Nachfolger Outlook und Messenger Skype</title>     
    <meta name="description" content="Nachrichten, Sport, Unterhaltung, Finanzen, Wetter, Reise, Gesundheit, Lifestyle und Rezepte, kombiniert mit Outlook, vormals Hotmail, Skype und Facebook"/>

<meta name="viewport" content="width=device-width,initial-scale=1, maximum-scale=1" />

<link rel="stylesheet" href="//static-hp-neu.s-msn.com/de-de/homepage/_sc/css/a948ecb3-49788a58/direction=ltr.locales=de-de.themes=start.dpi=resolution1x/f9-9b024b-627907c8/a0-318546-28fba29e/21-6ddefc-846b3b2e/a3-9c147b-74baf5b2/bd-3b6326-bdfd55f0/f2-9eb7b7-2182c5e1/weather-css-3f-bc2b1074ad8f00550fd4291cb33ce0-68ddb2ab/weather-css-65-6341176d2157b6b321f0d5b7797e91-12ce4544/finance-css-52-03305154c657e20cda79e04a4d3e45-60c9bccb/finance-css-69-86cde7ca12112455a01bf1c4e4ca4e-74a48c4/health-css-cc-6f1a79dbf4ab1f25e2e969f1b81bab-68ddb2ab?ver=2.0.5542.29760" media="all" />
    <script type="text/javascript">//<![CDATA[
(function(n,t){function o(n,i,r){typeof n!="string"&&(r=i,i=n,n=t);i&&i.splice||(r=i,i=[]);n=="c.dom"&&(l=!0);s(n,i,r)}function s(n,t,i,r){var e,o,s,h;n&&u[n]||(e=k(n,t),e?(s=typeof i=="function",h=l&&s&&n!="dap"&&n!="adLoad"&&t&&(t.length!=1||t[0]!="dap"&&t[0]!="c.dom"),h?setTimeout(function(){o=i.apply(null,e);a(n,o)},1):(o=s?i.apply(null,e):i,a(n,o))):f.push(r||{i:n,d:t,f:i}))}function a(t,i){t&&(i?(u[t]=i,v()):n.console&&console.error("Dependencies resolved, but object still not defined (or is otherwise falsey). id:"+t+"; typeof obj: "+typeof i))}function v(){var r,u,n,t;if(f.length&&!i){do for(r=f,u=r.length,f=[],i=1,t=0;t<u;t++)n=r[t],s(n.i,n.d,n.f,n);while(i>1);i=0}else i&&(i=2)}function k(i,r){for(var s,v,h,f=[],c=r?r.length:0,o=0;o<c;o++){var l=r[o],a=u[l],y=typeof a!="undefined";if(!y){if(s=b.exec(l),s)if(v=s[1],h=n[v],h!==t){f.push(h);continue}else e||(e=setTimeout(d,w));break}f.push(a)}return c==f.length?f:0}function d(){e=0;v()}function g(n,i,r){(typeof n!="object"||n&&n.splice)&&(r=i,i=n,n={});i&&i.splice||(r=i,i=[]);nt(n.js);r&&s(t,i,r)}function nt(n){if(typeof n=="string")y(n);else if(n)for(var t=0;t<n.length;t++)y(n[t])}function y(n){if(!c[n]){c[n]=1;var i=document.getElementsByTagName("script")[0],t=document.createElement("script");t.src=n;t.onload=t.onreadystatechange=function(){this.readyState&&this.readyState!="loaded"&&this.readyState!="complete"||(t.onload=t.onreadystatechange=null,t.parentNode&&t.parentNode.removeChild(t))};i.parentNode.insertBefore(t,i)}}function tt(n){return p?n?r.now():Math.round(r.now()):new Date-h}var r=n.performance,h=((r||{}).timing||{}).navigationStart||(n._timing||{}).start||+new Date,p=r&&typeof r.now=="function",u={image:Image,document:document,location:document.location,window:n,screen:screen,navigator:navigator,date:Date,pageTime:tt,pageStart:h},f=[],i,w=50,e,c={},l=!1,b=/^window\.(.+)$/;o.amd={jQuery:1};o.is=function(n){return typeof u[n]!="undefined"};n.define=o;n.require=g})(window);define("navigation",["escape","location"],function(n,t){function r(n,t,i){var s=function(n){return n=n.replace(/\+/g," "),decodeURIComponent(n)},u={},o,e;if(n)for(n=n.split("#")[0],o=n.split("&"),e=0;e<o.length;e++){var h=o[e].split("="),r=h[0],f=h[1];i&&(r=s(r),f&&(f=s(f)));t?(u[r]||(u[r]=[]),u[r].push(f)):u[r]=f}return u}function u(n){var t=f.exec(n);return t?t[2]:!1}var f=/[a-z][a-z0-9+\-.]*:\/\/([a-z0-9\-._~%!$&'()*+,;=]+@)?([a-z0-9\-._~%]+|\[[a-z0-9\-._~%!$&'()*+,;=:]+\])/i,i={getUrl:function(n){return i.filter?i.filter(n):n},navigate:function(n,r){i.filter&&(n=i.filter(n));r?t.replace(n):t.href=n},getHostName:u,isLocal:function(n){var i=u(n);return!i||t.hostname==i},getParams:r,getParamsFromUrl:function(n,t,i){var u=n.split("?")[1];return r(u,t,i)},mergeQueryStringParams:function(t,i){var e,f,o,u;if(i){if(e=t.split("?"),e[1]){f=r(e[1],!1,!0);for(u in i)f[u]=i[u]}else f=i;t=e[0];o="?";for(u in f)t+=f[u]?o+n.urlPart(u)+"="+n.urlPart(f[u]):o+n.urlPart(u),o="&"}return t},filter:null};return i});define("logging",["window"],function(n){function r(n,t){if(n.addEventListener)n.addEventListener("error",t,!1);else if(n.onerror){var i=n.onerror;n.onerror=function(n,r,u,f,e){return i(n,r,u,f,e),t(n,r,u,f,e)}}else n.onerror=t}function t(t){n.console&&(console.error||console.log)(t)}function u(){}function f(){}function e(t){(n.console||{}).timeStamp?console.timeStamp(t):(n.performance||{}).mark&&n.performance.mark(t)}var i=0;return r(n,function(n){return i++,n&&t("[SCRIPTERROR] "+n),!0}),{error:t,fatalError:t,unhandledErrorCount:function(){return i},perfMark:e,warning:u,information:f}})//]]></script><script type="text/javascript" src="//static-hp-neu.s-msn.com/_h/804ff984/webcore/externalscripts/jquery/jquery-1.11.1.min.js"></script>

            <script type="text/javascript"  src="//ads1.msads.net/library/8.3/dapmsn.js"></script>

    <style>.ie10plus ul.swipenav{display:inline-block}body:not(.startpage) #opensh{display:none!important}.homepage.midlevel .pagingsection>button.show,.channelplayerpage.midlevel .pagingsection>button.show{display:none}#main .linkskypeid.integratedskypeflyout>h3{display:none}</style>
</head>

<body class="startpage sp center-content start">

        <div id="banners">

    <span>Durch Nutzung dieser Webseite stimmen Sie der Verwendung von Cookies f&#252;r Analysezwecke, personalisierte Inhalte und Werbung zu.</span>

        </div>
    <div class="head">
        <div>
<div id="topnav">
        <ul class="verticalsnav">
                    <li  class="current">
                        <a href="/de-de">Startseite</a>
                    </li>
                    <li >
                        <a href="/de-de/nachrichten">Nachrichten</a>
                    </li>
                    <li >
                        <a href="/de-de/wetter">Wetter</a>
                    </li>
                    <li >
                        <a href="/de-de/unterhaltung">Unterhaltung</a>
                    </li>
                    <li >
                        <a href="/de-de/sport">Sport</a>
                    </li>
                    <li >
                        <a href="/de-de/finanzen">Finanzen</a>
                    </li>

                <li class="more">
                    <a href="#nav">Mehr ></a>
                    <ul>
        <li >
            <a href="/de-de/lifestyle">Lifestyle</a>
        </li>
        <li >
            <a href="/de-de/gesundheit">Gesundheit &amp; Fitness</a>
        </li>
        <li >
            <a href="/de-de/kochen-und-genuss">Kochen &amp; Genuss</a>
        </li>
        <li >
            <a href="/de-de/reisen">Reisen</a>
        </li>
        <li >
            <a href="/de-de/auto">Auto</a>
        </li>
        <li >
            <a href="/de-de/video">Video</a>
        </li>
                    </ul>
                </li>
        </ul>
</div>

                    <div id="header-common">
            <div class="header">
                <div class="header-logo">
                            <a class="logo" href="/de-de">

<img alt="" height="20" width="20" src="//static-hp-neu.s-msn.com/sc/6d/b23cf2.gif" />
        </a>
            <a class="vertical" href="/de-de">msn</a>

                </div>
                <div id="header-links">
                        <a href="http://www.outlook.com/">Outlook.com</a>
                        <span>|</span>
                        <a href="/de-de/settings/markettoggle"><img alt="de-de" src="//static-hp-neu.s-msn.com/sc/6a/a62410.gif" /></a>

                    <a class="navigation" href="#nav">
                        <img  alt="wechseln zu navigation" width="27" height="20" src="//static-hp-neu.s-msn.com/sc/57/a49b8d.gif" />
                    </a>
                </div>
            </div>
        </div>

<div id="header-search">
    <form action="http://www.bing.com/search?scope=web" method="get" id="srchfrm">
        <div class="searchbox">
            <input type="text" id="q" name="q" value="" />
            <input type="hidden" name="form" value="PRDEDL" />
            <input type="hidden" name="refig" value="2312586169574cdf8ac39a2eb03636d1">
            <input type="submit" class="text" value="Websuche" title="Websuche"/>
        </div>
    </form>
</div>

        </div>

            <div class="upgradebrowser">
                Sie verwenden eine veraltete Browserversion. Bitte verwenden Sie eine <a href="http://support2.microsoft.com/kb/2999871/de-de">unterstütze Version</a>damit Sie MSN optimal nutzen können.
            </div>

    </div>
    <div id="maincontent">

        <div id="main"  data-region="main">

        <div class="stripe first">
<h2>Heute</h2>    <a href="/de-de/nachrichten/politik/kopfsch%c3%bctteln-allerorten-athen-hat-viel-zeit-verspielt/ar-AA9zduo"
       >
<img alt="new caption" height="194" src="//img.s-msn.com/tenant/amp/entityid/AA9zDGZ.img?h=194&amp;w=300&amp;m=6&amp;q=60&amp;u=t&amp;o=t&amp;l=f" title="AFP" width="300" />
    </a>
                    <ul>
                            <li  class="first">
                                    <a href="/de-de/nachrichten/politik/kopfsch%c3%bctteln-allerorten-athen-hat-viel-zeit-verspielt/ar-AA9zduo"
       >

Kopfsch&#252;tteln allerorten: Athen hat viel Zeit verspielt    </a>

                            </li>
                            <li >
                                    <a href="/de-de/nachrichten/bildergalerien/apple-stellt-v%c3%b6llig-neues-macbook-vor-und-enth%c3%bcllt-letzte-infos-zur-watch/ss-AA9z2xo"
       >

Apple Watch: Das kann sie, so viel kostet sie    </a>

                            </li>
                            <li >
                                    <a href="/de-de/nachrichten/panorama/nichts-ist-wie-es-scheint-alles-ist-geplant/ar-AA9yiuP"
       >

Verschw&#246;rung? Nichts ist, wie es scheint    </a>

                            </li>
                            <li >
                                    <a href="/de-de/nachrichten/politik/eklat-hinter-den-kulissen-bei-%e2%80%9eg%c3%bcnther-jauch%e2%80%9c/ar-AA9yEcT"
       >

Eklat hinter den Kulissen bei „G&#252;nther Jauch“    </a>

                            </li>
                            <li >
                                    <a href="/de-de/finanzen/nachrichten/generationen-zwist-unter-metzgern/ar-AA9z5Cz"
       >

Schlappe f&#252;r Schlachter-K&#246;nig T&#246;nnies    </a>

                            </li>
                    </ul>

        </div>
        <div class="stripe">
<h2><a href="/de-de/nachrichten" >Nachrichten</a></h2>    <a href="/de-de/nachrichten/wissenundtechnik/apple-will-w%c3%bcnsche-wecken-die-wir-noch-nicht-kennen/ar-AA9yXxe"
       >
<img alt="new caption" height="194" src="//img.s-msn.com/tenant/amp/entityid/AA9zdx0.img?h=194&amp;w=300&amp;m=6&amp;q=60&amp;u=t&amp;o=t&amp;l=f&amp;x=1015&amp;y=972" title="Bloomberg" width="300" />
    </a>
                    <ul>
                            <li  class="first">
                                    <a href="/de-de/nachrichten/wissenundtechnik/apple-will-w%c3%bcnsche-wecken-die-wir-noch-nicht-kennen/ar-AA9yXxe"
       >

Apple will W&#252;nsche wecken, die wir noch nicht kennen    </a>

                            </li>
                            <li >
                                    <a href="/de-de/nachrichten/other/das-passiert-heute-wer-bekommt-edathys-geld/ar-AA9zDTg"
       >

Das passiert heute: Wer bekommt Edathys Geld?    </a>

                            </li>
                            <li >
                                    <a href="/de-de/nachrichten/other/man%c3%b6ver-unter-us-f%c3%bchrung-nato-probt-marineeins%c3%a4tze-im-schwarzen-meer/vi-AA9zlqD"
       >

Man&#246;ver unter US-F&#252;hrung: Nato probt Marineeins&#228;tze im Schwarzen Meer    </a>

                            </li>
                            <li >
                                    <a href="/de-de/nachrichten/other/apple-stellt-watch-vor-%e2%80%93-ab-10-april-bestellbar/vi-AA9z9zR"
       >

Apple stellt Watch vor – ab 10. April bestellbar    </a>

                            </li>
                            <li >
                                    <a href="/de-de/nachrichten/politik/keinen-is-k%c3%a4mpfer-wollen-sie-entkommen-lassen/ar-AA9yZZk"
       >

Keinen IS-K&#228;mpfer wollen sie entkommen lassen    </a>

                            </li>
                    </ul>

        </div>
    <div  class="ad"  id="rectangle1_homepage_cf0a5546-df18-4dff-ab8c-62425edbf3f5">
        <div>
            <div  id="rectangle1_homepage_container_cf0a5546-df18-4dff-ab8c-62425edbf3f5">
                    <script type="text/javascript">
                        //<![CDATA[
                        (function define_dap() 
                        {
                            if (window.dap)
                            {
                                return;
                            }

                            // all data needed to render the ads or refresh them
                            var postEvaluationClassname = "non-empty-ad";
                            var postEvaluationAdSmallClassname = "layout-small";
                            var postEvaluationAdMediumClassname = "layout-medium";
                            var postEvaluationAdLargeClassname = "layout-large";
                            var postEvaluationNoAdClassname = "no-ad";

                            var mediumAdHeight = 200;
                            var largeAdHeight = 550;

                            var numEvalPasses = 10;
                            var contentCheckTimeout = 300;
                            var discernibleAdHeightThreshold = 30;
                            var discernibleAdWidthThreshold = 40;

                            var AdSizeType =
                            {
                                NotAnAd: 0,                     // dimensions are both 0
                                PointSizedAd: 1,                // dimensions are both under threshold
                                NonPointSizedAd: 2,             // dimensions are both above threshold (full size)
                                Inconclusive: 3                 // one dimension is 0, and the other is above threshold
                            };

                            function dapResult(params, width, height, htmlid)
                            {
                                var elem = document.getElementById(htmlid);
                                if (!elem)
                                {
                                    return;
                                }

                                dapMgr.renderAd(htmlid, params, width, height);

                                var renderData = {
                                    params: params,
                                    width: width,
                                    height: height,
                                    htmlid: htmlid,
                                    adSizeType: AdSizeType.NotAnAd,
                                    canDisplayAdChoices: false,
                                    elem: elem
                                };

                                checkAndSetAdContainerVisibility(renderData);
                            }

                            function checkAndSetAdContainerVisibility(renderData)
                            {
                                var retries = numEvalPasses;

                                checkAndSetAdContainerVisibilityRec();

                                function checkAndSetAdContainerVisibilityRec(finalCheck)
                                {
                                    retries--;
                                    var adId = renderData.htmlid;

                                    checkVisibilityAndUpdateRenderDataContextForElement(renderData);

                                    var isLastPass = (retries === 0);
                                    var adSizeType = renderData.adSizeType;
                                    var adDetected = adSizeType !== AdSizeType.Inconclusive;
                                    var doShow = adSizeType === AdSizeType.NonPointSizedAd;
                                    if (adDetected || isLastPass)
                                    {
                                        var adSizeClassname = postEvaluationNoAdClassname;
                                        if (doShow)
                                        {
                                            if (renderData.height < mediumAdHeight)
                                            {
                                                adSizeClassname = postEvaluationAdSmallClassname;
                                            }
                                            else if (renderData.height < largeAdHeight)
                                            {
                                                adSizeClassname = postEvaluationAdMediumClassname;
                                            }
                                            else
                                            {
                                                adSizeClassname = postEvaluationAdLargeClassname;
                                            }
                                        }

                                        setAdContainerDisplayState(adId, doShow, adSizeClassname);

                                        // last final check for RM
                                        if (!finalCheck)
                                        {
                                            setTimeout(
                                                function finalCheckOnAdContainer()
                                                {
                                                    checkAndSetAdContainerVisibilityRec(true);
                                                }, 
                                                (numEvalPasses * contentCheckTimeout) >> 1);
                                        }
                                    } 
                                    else
                                    {
                                        // if we got here, we didn't find anything but script. Try again later.
                                        setTimeout(checkAndSetAdContainerVisibilityRec, contentCheckTimeout);
                                    }
                                }
                            }

                            function checkVisibilityAndUpdateRenderDataContextForElement(renderData)
                            {
                                if (!renderData)
                                {
                                    return;
                                }
                                evaluateAdContent(renderData);
                            }

                            function evaluateAdContent(renderData)
                            {
                                var adContainer = renderData && renderData.elem;
                                if (!adContainer)
                                {
                                    renderData.adSizeType = AdSizeType.Inconclusive;
                                }

                                var adIframeCollection = adContainer.getElementsByTagName("iframe");
                                var evaluationResult;
                                for (var adIframe, ndx = 0; (adIframe = adIframeCollection[ndx]); ++ndx)
                                {
                                    // skip script-only iFrame elements
                                    var body = ((adIframe.contentDocument || (adIframe.contentWindow || {}).document) || {}).body;
                                    if (!body || !body.hasChildNodes())
                                    {
                                        continue;
                                    }

                                    var childNode, hasChildDiv = false;
                                    for (var index = body.childNodes.length - 1; (childNode = body.childNodes[index]); --index)
                                    {
                                        if (childNode.nodeType === 1 
                                            && childNode.nodeName !== "SCRIPT")
                                        {
                                            hasChildDiv = true;
                                            renderData.adSizeType = evaluateElement(childNode, renderData);
                                            if (renderData.adSizeType === AdSizeType.NonPointSizedAd)
                                            {
                                                return;
                                            }
                                        }

                                        // Bug 1715559:[dl_ux][FF9.0] [Win7] - Advertisement is overlapping destination section
                                        // For FF lower versions (FF9.0), index may be negative and hence cause js errors
                                        // Add index value check to solve the problem
                                        if (index <= 0)
                                        {
                                            break;
                                        }
                                    }

                                    if (renderData.adSizeType !== AdSizeType.NonPointSizedAd && hasChildDiv)
                                    {
                                        renderData.adSizeType = evaluateElement(adIframe, renderData);
                                    }

                                    if (renderData.adSizeType === AdSizeType.NonPointSizedAd)
                                    {
                                        return;
                                    }
                                }

                                // extract the characteristics of the div immediate children
                                var adDivCollection = adContainer.getElementsByTagName("div");
                                for (var adDiv, ndx = 0; (adDiv = adDivCollection[ndx]); ++ndx)
                                {
                                    renderData.adSizeType = evaluateElement(adDiv, renderData);

                                    if (renderData.adSizeType === AdSizeType.NonPointSizedAd)
                                    {
                                        return;
                                    }
                                }
                            }

                            function evaluateElement(element, renderData)
                            {
                                var maxWidth = evaluateElementDimension(element, true, discernibleAdWidthThreshold);
                                var maxHeight = evaluateElementDimension(element, false, discernibleAdHeightThreshold);

                                renderData.width = maxWidth;
                                renderData.height = maxHeight;

                                if (maxWidth > discernibleAdWidthThreshold && maxHeight > discernibleAdHeightThreshold)
                                {
                                    return AdSizeType.NonPointSizedAd;
                                }
                                if (maxWidth > 0 && maxHeight > 0)
                                {
                                    return AdSizeType.PointSizedAd;
                                }
                                return AdSizeType.Inconclusive;
                            }

                            function evaluateElementDimension(element, isWidth, threshold)
                            {
                                var dimensionProperties = isWidth ? ["width", "offsetWidth", "scrollWidth"] : ["height", "offsetHeight", "scrollHeight"];
                                var pixelStyle = isWidth ? "pixelWidth" : "pixelHeight";
                                var dimensionStyle = isWidth ? "width" : "height";
                                var totalProperties = 3;
                                var maxDimension = 0, dimension = 0;

                                for (var i = 0; i < totalProperties; i++)
                                {
                                    if ((dimension = element[dimensionProperties[i]]) > maxDimension) 
                                    {
                                        maxDimension = dimension;
                                        if (maxDimension > threshold) 
                                        {
                                            break;
                                        }
                                    }
                                }

                                var elemStyle = element.style;
                                if (maxDimension <= threshold && elemStyle)
                                {
                                    if ((dimension = elemStyle[pixelStyle]) > maxDimension)
                                    {
                                        maxDimension = dimension;
                                        if (maxDimension <= threshold && (dimension = parseInt(elemStyle[dimensionStyle])) > maxDimension)
                                        {
                                            maxDimension = dimension;
                                        }
                                    }
                                }

                                return maxDimension;
                            }

                            function setAdContainerDisplayState(elemId, doShow, adSizeClassname)
                            {
                                var adHtmlContainer = ((document.getElementById(elemId) || {}).parentNode || {}).parentNode;
                                if (!adHtmlContainer)
                                {
                                    return;
                                }

                                adHtmlContainer.style.display = doShow ? "" : "none";
                                var className = adHtmlContainer.className;

                                className = addOrRemoveClassname(className, postEvaluationClassname, doShow);
                                className = addOrRemoveClassname(className, postEvaluationAdSmallClassname, adSizeClassname === postEvaluationAdSmallClassname);
                                className = addOrRemoveClassname(className, postEvaluationAdMediumClassname, adSizeClassname === postEvaluationAdMediumClassname);
                                className = addOrRemoveClassname(className, postEvaluationAdLargeClassname, adSizeClassname === postEvaluationAdLargeClassname);
                                className = addOrRemoveClassname(className, postEvaluationNoAdClassname, adSizeClassname === postEvaluationNoAdClassname);

                                adHtmlContainer.className = className;
                            }

                            function addOrRemoveClassname(classNameList, className, add)
                            {
                                var classIndex = classNameList.indexOf(className);
                                if (add)
                                {
                                    if (classIndex === -1)
                                    {
                                        return classNameList + " " + className;
                                    }
                                }
                                else if (classIndex >= 0)
                                {
                                    return classNameList.replace(className, "");
                                }
                                return classNameList;
                            }

                            window.dap = dapResult;
                        })();
                        //]]>

                            dap("&amp;AP=1089&amp;PG=MSNDEDE11&amp;PVGUID=2312586169574cdf8ac39a2eb03636d1&amp;PROVIDERID=7HD66FC", 300, 250, "rectangle1_homepage_container_cf0a5546-df18-4dff-ab8c-62425edbf3f5");
                    </script>
            </div>
                    <a href="http://go.microsoft.com/fwlink/?LinkID=286759" target="_blank" class="adchoices" data-piitxt="adchoices">
                        <span> | Anzeige</span>
                    </a>
        </div>
    </div>
        <div class="stripe">
<h2>Einkaufen</h2>    <a href="/de-de/finanzen/top-stories/computer-mittwochs-kaufen-schuhe-donnerstags/ar-AA9s06u"
       >
<img alt="Online Schuhe shoppen - am besten donnerstags" height="194" src="//img.s-msn.com/tenant/amp/entityid/BBhCSqz.img?h=194&amp;w=300&amp;m=6&amp;q=60&amp;u=t&amp;o=t&amp;l=f" title="GARO/PHANIE/REX" width="300" />
    </a>
                    <ul>
                            <li  class="first">
                                    <a href="/de-de/finanzen/top-stories/computer-mittwochs-kaufen-schuhe-donnerstags/ar-AA9s06u"
       >

Computer mittwochs kaufen, Schuhe donnerstags    </a>

                            </li>
                            <li >
                                    <a href="/de-de/finanzen/top-stories/verbraucherpreise-sinken-gewinner-und-verlierer/ar-BBi1TT6"
       >

Verbraucherpreise sinken: Gewinner und Verlierer    </a>

                            </li>
                            <li >
                                    <a href="/de-de/finanzen/top-stories/die-teuersten-einkaufsstra%c3%9fen-der-welt/ss-BBgccw1"
       >

Die teuersten Einkaufsstra&#223;en der Welt    </a>

                            </li>
                            <li >
                                    <a href="/de-de/finanzen/top-stories/neuer-werbespot-des-aldi-konkurrenten-%e2%80%9e%c3%bcberhaupt-nichts-mit-der-marke-lidl-zu-tun%e2%80%9c/ar-BBhUZTq"
       >

Neuer Werbespot: Lidl will Edelmarke werden    </a>

                            </li>
                            <li >
                                    <a href="/de-de/finanzen/top-stories/discounter-wollen-mehr-bieten-als-nur-billig/ar-BBhZPif"
       >

Discounter wollen mehr bieten als nur billig    </a>

                            </li>
                    </ul>

        </div>
        <div class="stripe">
<h2><a href="/de-de/unterhaltung" >Unterhaltung</a></h2>    <a href="/de-de/unterhaltung/nachrichten/notruf-aus-newtopia/ar-AA9yG3h"
       >
<img alt="Ernster Zwischenfall in &quot;Newtopia&quot;: Isolde bricht zusammen - ein Notarzt muss kommen" height="194" src="//img.s-msn.com/tenant/amp/entityid/AA9yIGU.img?h=194&amp;w=300&amp;m=6&amp;q=60&amp;u=t&amp;o=t&amp;l=f" title="Newtopia/Sat.1" width="300" />
    </a>
                    <ul>
                            <li  class="first">
                                    <a href="/de-de/unterhaltung/nachrichten/notruf-aus-newtopia/ar-AA9yG3h"
       >

Notruf aus &quot;Newtopia&quot;    </a>

                            </li>
                            <li >
                                    <a href="/de-de/unterhaltung/nachrichten/videokonferenz-mit-helene-fischer-m%c3%b6glich/ar-AA9yvub"
       >

Helene Fischer: Video-Aussage vor Gericht?    </a>

                            </li>
                            <li >
                                    <a href="/de-de/unterhaltung/nachrichten/daniel-k%c3%bcblb%c3%b6ck-er-zeigt-seinen-geheimen-freund/ar-AA9ylW2"
       >

Daniel K&#252;blb&#246;ck: Er zeigt seinen geheimen Freund!    </a>

                            </li>
                            <li >
                                    <a href="/de-de/unterhaltung/musik/tokio-hotel-lassen-ihre-fans-tief-in-die-tasche-greifen/ar-AA9ykGi"
       >

Zocken Tokio Hotel ihre Fans ab?    </a>

                            </li>
                            <li >
                                    <a href="/de-de/unterhaltung/nachrichten/carolin-kebekus-vergleicht-helene-fischer-fans-mit-ultras-des-1-fc-k%c3%b6ln/ar-AA9ymly"
       >

Kebekus vergleicht Helene-Fischer-Fans mit Ultras des 1. FC K&#246;ln    </a>

                            </li>
                    </ul>

        </div>
        <div class="stripe">
<h2><a href="/de-de/sport" >Sport</a></h2>    <a href="/de-de/sport/fussball/schalke-will-sich-nur-nicht-abschlachten-lassen/ar-AA9yrpJ"
       >
<img alt="Schalkes Japaner Atsuto Uchida, links, am 18. Februar 2015 im Hinspiel des Achtelfinals der Champions League im Laufduell mit dem Madrilenen Cristiano Ronaldo." height="194" src="//img.s-msn.com/tenant/amp/entityid/AA9yNFz.img?h=194&amp;w=300&amp;m=6&amp;q=60&amp;u=t&amp;o=t&amp;l=f&amp;x=1367&amp;y=216" title="Martin Meissner, AP Photo" width="300" />
    </a>
                    <ul>
                            <li  class="first">
                                    <a href="/de-de/sport/fussball/schalke-will-sich-nur-nicht-abschlachten-lassen/ar-AA9yrpJ"
       >

Schalkes Angst, &quot;abgeschlachtet&quot; zu werden    </a>

                            </li>
                            <li >
                                    <a href="/de-de/sport/fussball/%c2%abcarlettos%c2%bb-weiche-hand/ar-AA9yEjM"
       >

Chance f&#252;r Schalke? &quot;Real ist langsam und ziemlich konfus&quot;    </a>

                            </li>
                            <li >
                                    <a href="/de-de/sport/wintersport/schweinsteiger-gegen-neureuther-rennen-am-gudiberg/ar-AA9xW1L"
       >

Gaudi am Gudiberg: Neureuther f&#228;hrt Slalom gegen Schweinsteiger    </a>

                            </li>
                            <li >
                                    <a href="/de-de/sport/wintersport/neureuthers-lobeshymne-auf-hirscher/ar-AA9xSRH"
       >

Was Neureuther wirklich von Hirscher h&#228;lt    </a>

                            </li>
                            <li >
                                    <a href="/de-de/sport/tennis/kerber-auf-der-us-tour-mit-trainer-torben-beltz/ar-AA9ysNg"
       >

Kerber kehrt zu ihrem alten Coach zur&#252;ck    </a>

                            </li>
                    </ul>

        </div>
        <div class="stripe">
<h2><a href="/de-de/finanzen" >Finanzen</a></h2>    <a href="/de-de/finanzen/other/streik-in-kitas-eltern-ratlos/ar-AA9yPdq"
       >
<img alt="Erzieher-Warnstreik: Vergangene Woche demonstrierten 2000 Lehrer." height="194" src="//img.s-msn.com/tenant/amp/entityid/AA9yHyw.img?h=194&amp;w=300&amp;m=6&amp;q=60&amp;u=t&amp;o=t&amp;l=f" title="dpa" width="300" />
    </a>
                    <ul>
                            <li  class="first">
                                    <a href="/de-de/finanzen/other/streik-in-kitas-eltern-ratlos/ar-AA9yPdq"
       >

Streik in Kitas, Eltern ratlos    </a>

                            </li>
                            <li >
                                    <a href="/de-de/finanzen/top-stories/zweifel-an-raschem-freihandelsvertrag-von-eu-und-japan/ar-AA9yIrb"
       >

Zweifel an raschem Freihandelsvertrag von EU und Japan    </a>

                            </li>
                            <li >
                                    <a href="/de-de/finanzen/top-stories/ezb-%c3%b6ffnet-die-geldschleusen-dax-geht-die-puste-aus/ar-AA9yfoy"
       >

EZB &#246;ffnet die Geldschleusen - Dax geht die Puste aus    </a>

                            </li>
                            <li >
                                    <a href="/de-de/finanzen/top-stories/lassen-sie-sich-%c3%bcberwachen-%e2%80%93-und-sparen-sie-geld/ar-AA9xYJb"
       >

Lassen Sie sich &#252;berwachen – und sparen Sie Geld    </a>

                            </li>
                            <li >
                                    <a href="/de-de/finanzen/other/general-motors-sch%c3%bcttet-milliarden-an-aktion%c3%a4re-aus/ar-AA9yy45"
       >

General Motors sch&#252;ttet Milliarden an Aktion&#228;re aus    </a>

                            </li>
                    </ul>

        </div>
        <div class="stripe">
<h2><a href="/de-de/lifestyle" >Lifestyle</a></h2>    <a href="/de-de/lifestyle/leben/happy-birthday-barbie/ss-AA9y26K"
       >
<img alt="new caption" height="194" src="//img.s-msn.com/tenant/amp/entityid/AA9soiv.img?h=194&amp;w=300&amp;m=6&amp;q=60&amp;u=t&amp;o=t&amp;l=f&amp;x=1508&amp;y=321" title="Getty Images/Getty Images" width="300" />
    </a>
                    <ul>
                            <li  class="first">
                                    <a href="/de-de/lifestyle/leben/happy-birthday-barbie/ss-AA9y26K"
       >

Happy Birthday, Barbie!    </a>

                            </li>
                            <li >
                                    <a href="/de-de/lifestyle/style/f%c3%bcnf-goldene-beauty-regeln/ss-AA9ysSV"
       >

F&#252;nf goldene Beauty-Regeln    </a>

                            </li>
                            <li >
                                    <a href="/de-de/lifestyle/leben/liebe-and-beziehung-beim-verlieben-gibt-es-keine-regeln/ar-AA9tTve"
       >

Liebe &amp; Beziehung: Auf diese Date-Tipps k&#246;nnen Sie verzichten    </a>

                            </li>
                            <li >
                                    <a href="/de-de/lifestyle/lifestylewomen/sex-liebe-karriere-neun-frauenfakten-im-check/ar-AA9w7sp"
       >

Sex, Liebe, Karriere - Neun Frauenfakten im Check    </a>

                            </li>
                            <li >
                                    <a href="/de-de/lifestyle/style/sara-sampaio-bunt-and-sexy-portugiesisches-model-wirbt-f%c3%bcr-calzedonia-bademode/ar-BBihfaq"
       >

Bunt &amp; sexy! Model Sara Sampaio im Bikini    </a>

                            </li>
                    </ul>

        </div>
        <div class="stripe">
<h2><a href="/de-de/gesundheit" >Gesundheit &amp; Fitness</a></h2>    <a href="/de-de/gesundheit/kraft/wieso-sport-schlau-macht/ss-AA9woHq"
       >
<img alt="new caption" height="194" src="//img.s-msn.com/tenant/amp/entityid/AA9yyoM.img?h=194&amp;w=300&amp;m=6&amp;q=60&amp;u=t&amp;o=t&amp;l=f" title="Foto: Getty Images" width="300" />
    </a>
                    <ul>
                            <li  class="first">
                                    <a href="/de-de/gesundheit/kraft/wieso-sport-schlau-macht/ss-AA9woHq"
       >

Wieso Sport schlau macht    </a>

                            </li>
                            <li >
                                    <a href="/de-de/gesundheit/medizinisch/herzerkrankungen-frauen-sind-st%c3%a4rker-betroffen/ar-AA9xLs8"
       >

Herzerkrankungen: Frauen sind st&#228;rker betroffen    </a>

                            </li>
                            <li >
                                    <a href="/de-de/gesundheit/ernaehrung/ballaststoffe-diese-lebensmittel-halten-lange-satt/ss-BBicdTp"
       >

Ballaststoffe: Diese Lebensmittel machen lange satt!    </a>

                            </li>
                            <li >
                                    <a href="/de-de/gesundheit/ernaehrung/neue-studie-beweist-margarine-ist-ges%c3%bcnder-als-butter/ss-BBijHZT"
       >

Neue Studie beweist: Margarine ist ges&#252;nder als Butter!    </a>

                            </li>
                    </ul>

        </div>
        <div class="stripe">
<h2><a href="/de-de/kochen-und-genuss" >Kochen &amp; Genuss</a></h2>    <a href="/de-de/kochen-und-genuss/rezepte/h%c3%a4hnchen-nach-j%c3%a4gerart/fd-9ce3ffb4-8a6a-5388-a71a-84af5c057886"
       >
<img alt="Hähnchen nach Jägerart" height="194" src="//img.s-msn.com//tenant/amp/entityid/AA9yrjo/_h194_w300_m6_utrue_otrue_lfalse.jpg" width="300" />
    </a>
                    <ul>
                            <li  class="first">
                                    <a href="/de-de/kochen-und-genuss/rezepte/h%c3%a4hnchen-nach-j%c3%a4gerart/fd-9ce3ffb4-8a6a-5388-a71a-84af5c057886"
       >

H&#228;hnchen nach J&#228;gerart    </a>

                            </li>
                            <li >
                                    <a href="/de-de/kochen-und-genuss/essen-news/trend-der-filterkaffee-ist-zur%c3%bcck/ar-AA9sRzO"
       >

Trend: Der Filterkaffee ist zur&#252;ck    </a>

                            </li>
                            <li >
                                    <a href="/de-de/kochen-und-genuss/essen-news/10-geniale-rezeptideen-mit-frischk%c3%a4se/ss-AA9n81a"
       >

10 geniale Rezeptideen mit Frischk&#228;se    </a>

                            </li>
                            <li >
                                    <a href="/de-de/kochen-und-genuss/other/detox-zum-fr%c3%bchst%c3%bcck-so-gut-schmeckt-die-detox-kur/ar-BBfYXSN"
       >

Detox zum Fr&#252;hst&#252;ck: so gut schmeckt die Detox-Kur    </a>

                            </li>
                            <li >
                                    <a href="/de-de/kochen-und-genuss/essen-news/die-wahrscheinlich-besten-muffin-rezepte-der-welt/ss-BBi8mGu"
       >

Die wahrscheinlich besten Muffin Rezepte der Welt    </a>

                            </li>
                    </ul>

        </div>
        <div class="stripe">
<h2><a href="/de-de/reisen" >Reisen</a></h2>    <a href="/de-de/reisen/artikel/venezianisches-flair-oder-hamburger-kiez-spontane-trips-f%c3%bcr-den-resturlaub-aus-2014/ss-BBijsWm"
       >
<img alt="Um diese Jahreszeit ist Venedig viel leerer und dadurch um einiges angenehmer als etwa im Hochsommer. Ist der Karneval Mitte Februar erst einmal rum, können Besucher ganz entspannt durch die Gassen schlendern. Besondere Hingucker sind der Dogenpalast und der Markusdom, die bei einer Erkundungsreise auf keinem Fall fehlen dürfen." height="194" src="//img.s-msn.com/tenant/amp/entityid/BBijFW3.img?h=194&amp;w=300&amp;m=6&amp;q=60&amp;u=t&amp;o=t&amp;l=f" title="GetYourGuide" width="300" />
    </a>
                    <ul>
                            <li  class="first">
                                    <a href="/de-de/reisen/artikel/venezianisches-flair-oder-hamburger-kiez-spontane-trips-f%c3%bcr-den-resturlaub-aus-2014/ss-BBijsWm"
       >

Spontane Trips f&#252;r den Resturlaub aus 2014    </a>

                            </li>
                            <li >
                                    <a href="/de-de/reisen/artikel/das-hotel-der-zukunft-er%c3%b6ffnet-in-wien/ss-BBii0H7"
       >

Das Hotel der Zukunft er&#246;ffnet in Wien    </a>

                            </li>
                            <li >
                                    <a href="/de-de/reisen/artikel/welches-wahrzeichen-ist-das/ss-BBddSlH"
       >

Welches Wahrzeichen ist das?    </a>

                            </li>
                            <li >
                                    <a href="/de-de/reisen/artikel/neun-trendige-reiseziele-f%c3%bcr-2015-von-portland-bis-zur-w%c3%bcste-gobi/ss-BBicSXY"
       >

Neun trendige Reiseziele f&#252;r 2015: Von Portland bis zur W&#252;ste Gobi    </a>

                            </li>
                            <li >
                                    <a href="/de-de/reisen/artikel/verwunschene-wege-unter-bl%c3%a4tterd%c3%a4chern/ss-BBi8ktO"
       >

Verwunschene Wege unter Bl&#228;tterd&#228;chern    </a>

                            </li>
                    </ul>

        </div>
        <div class="stripe">
<h2><a href="/de-de/auto" >Auto</a></h2>    <a href="/de-de/auto/nachrichten/die-hei%c3%9festen-girls-aus-genf-genfer-autosalon-2015/ar-BBif91D"
       >
<img alt="new caption" height="194" src="//img.s-msn.com/tenant/amp/entityid/AA9xPMt.img?h=194&amp;w=300&amp;m=6&amp;q=60&amp;u=t&amp;o=t&amp;l=f&amp;x=807&amp;y=280" title="Auto Motor und Sport" width="300" />
    </a>
                    <ul>
                            <li  class="first">
                                    <a href="/de-de/auto/nachrichten/die-hei%c3%9festen-girls-aus-genf-genfer-autosalon-2015/ar-BBif91D"
       >

Die hei&#223;esten Girls aus Genf - Genfer Autosalon 2015    </a>

                            </li>
                            <li >
                                    <a href="/de-de/auto/oldtimer/7-oldtimer-schn%c3%a4ppchen-von-2550-bis-23900-%e2%82%ac-klassiker-zum-sonderpreis/ar-AA9vyOb"
       >

7 Oldtimer-Schn&#228;ppchen von 2.550 bis 23.900 € - Klassiker zum Sonderpreis    </a>

                            </li>
                            <li >
                                    <a href="/de-de/auto/nachrichten/satte-ps-zugabe-f%c3%bcr-die-werksautos-tuning-auf-dem-genfer-autosalon-2015/ar-AA9tCQW"
       >

Satte PS-Zugabe f&#252;r die Werksautos - Tuning auf dem Genfer Autosalon 2015    </a>

                            </li>
                            <li >
                                    <a href="/de-de/auto/other/sitzprobe-audi-r8/ss-AA9sEyH"
       >

Sitzprobe Audi R8    </a>

                            </li>
                            <li >
                                    <a href="/de-de/auto/nachrichten/coup%c3%a9-kommt-mit-f%c3%bcnfliter-v8-erlk%c3%b6nig-hyundai-genesis-coup%c3%a9-2016/ar-AA9txR4"
       >

Coup&#233; kommt mit F&#252;nfliter-V8 - Erlk&#246;nig Hyundai Genesis Coup&#233; (2016)    </a>

                            </li>
                    </ul>

        </div>
        <div class="stripe">
<h2><a href="/de-de/video" >Video</a></h2>    <a href="/de-de/video/nachrichten/mumifizierte-bergsteiger-entdeckt/vi-AA9uBYh"
       >
<img alt="Mumifizierte Bergsteiger entdeckt" height="194" src="//img.s-msn.com/tenant/amp/entityid/AA9uJIr.img?h=194&amp;w=300&amp;m=6&amp;q=60&amp;u=t&amp;o=t&amp;l=f" title="Reuters" width="300" />
    </a>
                    <ul>
                            <li  class="first">
                                    <a href="/de-de/video/nachrichten/mumifizierte-bergsteiger-entdeckt/vi-AA9uBYh"
       >

Mumifizierte Bergsteiger entdeckt    </a>

                            </li>
                            <li >
                                    <a href="/de-de/video/nachrichten/drogenschmuggler-werfen-ballast-ab/vi-AA9y3Dc"
       >

Drogenschmuggler werfen &quot;Ballast&quot; ab    </a>

                            </li>
                            <li >
                                    <a href="/de-de/video/nachrichten/hereinspaziert-wilder-l%c3%b6we-%c3%b6ffnet-autot%c3%bcr/vi-BBigvur"
       >

Hereinspaziert: Wilder L&#246;we &#246;ffnet Autot&#252;r    </a>

                            </li>
                            <li >
                                    <a href="/de-de/video/ansehen/crash-in-taiwan-dashcam-zeichnet-alles-auf/vi-AA9uQNf"
       >

Crash in Taiwan: Dashcam zeichnet alles auf    </a>

                            </li>
                            <li >
                                    <a href="/de-de/video/nachrichten/vin-diesel-ist-der-star-mit-den-meisten-facebook-freunden/vi-AA9xvIH"
       >

Vin Diesel ist der Star mit den meisten Facebook-Freunden    </a>

                            </li>
                    </ul>

        </div>

        </div>
        <div id="aside"  data-region="aside">

        </div>
<div id="nav">
        <ul class="verticalsnav">
                <li  class="current">
                    <a href="/de-de">Startseite</a>
                </li>
                <li >
                    <a href="/de-de/nachrichten">Nachrichten</a>
                </li>
                <li >
                    <a href="/de-de/wetter">Wetter</a>
                </li>
                <li >
                    <a href="/de-de/unterhaltung">Unterhaltung</a>
                </li>
                <li >
                    <a href="/de-de/sport">Sport</a>
                </li>
                <li >
                    <a href="/de-de/finanzen">Finanzen</a>
                </li>
                <li >
                    <a href="/de-de/lifestyle">Lifestyle</a>
                </li>
                <li >
                    <a href="/de-de/gesundheit">Gesundheit &amp; Fitness</a>
                </li>
                <li >
                    <a href="/de-de/kochen-und-genuss">Kochen &amp; Genuss</a>
                </li>
                <li >
                    <a href="/de-de/reisen">Reisen</a>
                </li>
                <li >
                    <a href="/de-de/auto">Auto</a>
                </li>
                <li >
                    <a href="/de-de/video">Video</a>
                </li>
        </ul>
</div>
    </div>
    <div id="foot">
        <div>            <a href="http://www.microsoft.com/de-de/">&#169; 2015 Microsoft</a>
            <a href="http://go.microsoft.com/fwlink/?LinkId=248688">Datenschutz und Cookies</a>
            <a href="http://windows.microsoft.com/de-de/windows-live/microsoft-services-agreement">Nutzungsbedingungen</a>
            <a href="http://go.microsoft.com/fwlink/?LinkID=286759">&#220;ber unsere Anzeigen</a>
            <a href="https://jfe.qualtrics.com/form/SV_d4ir2X6Zkgjw0rb">Feedback</a>
            <a href="/de-de/nachrichten/schlagzeilen/Impressum/ar-BB56cmH">Impressum</a>
            <a href="/de-de/msn-worldwide">MSN Weltweit</a>
            <a href="http://www.bing.com/explore/newsletter?mkt=de-de&amp;FORM=MF12BH&amp;OCID=MF12BH&amp;wt.mc_id=MF12BH">Newsletter</a>
            <a href="http://go.microsoft.com/fwlink/?LinkId=512703">Hilfe</a>
            <a href="http://advertising.microsoft.com/de-de">Werben auf MSN</a>
</div>
    </div>
            <div>
            <img src="//c.msn.com/c.gif?udc=true&amp;rid=2312586169574cdf8ac39a2eb03636d1&amp;rnd=635615492100105610&amp;rf=&amp;tp=http%253A%252F%252Fwww.msn.com%252Fde-de%252F&amp;di=108&amp;lng=de-de&amp;cv.product=prime&amp;d.dg1=&amp;d.dg2=&amp;d.dg3=&amp;d.dg4=&amp;d.dgk=downlevel.pc&amp;d.imd=0&amp;d.b=Mozilla&amp;d.bv=0.0&amp;d.p=Unknown&amp;d.pv=Unknown%20Unknown" alt="image beacon" width="1" height="1" /><img src="http://b.scorecardresearch.com/p?c1=2&amp;c2=3000001&amp;rn=635615492100105610&amp;c7=http%253A%252F%252Fwww.msn.com%252Fde-de%252F&amp;c8=&amp;c9=" alt="image beacon" width="1" height="1" /><img src="//otf.msn.com/c.gif?js=0&amp;evt=impr&amp;di=108&amp;pi=&amp;ps=&amp;su=http%253A%252F%252Fwww.msn.com%252Fde-de%252F&amp;pageid=startpage&amp;mkt=de-de&amp;pn=startpage&amp;mv=15&amp;pp=False&amp;cv.product=prime&amp;cv.partner=&amp;cv.publcat=&amp;st.dpt=&amp;st.sdpt=&amp;dv.Title1=&amp;cts=635615492100105610&amp;rf=&amp;rid=2312586169574cdf8ac39a2eb03636d1&amp;cvs=Browser&amp;subcvs=homepage&amp;cv.entityId=&amp;cv.entitySrc=&amp;provid=&amp;ar=0&amp;d.dg1=&amp;d.dg2=&amp;d.dg3=&amp;d.g4=&amp;d.dgk=downlevel.pc&amp;d.imd=0&amp;d.b=Mozilla&amp;d.bv=0.0&amp;d.p=Unknown&amp;d.pv=Unknown%20Unknown" alt="image beacon" width="1" height="1" />
        </div>

</body>
    <!--MSNAvailToken--></html>

Thanks and sorry for the long comment.

matt-peters commented 9 years ago

This page parses fine for me. What version of lxml are you using? I'm using 3.4.1.

matt-peters commented 9 years ago

FWIW, BlockifyError is only raised when lxml can't parse the document.

slitayem commented 9 years ago

I'm using lxml 3.4.3.

matt-peters commented 9 years ago

Upgraded to lxml 3.4.3 but can't reproduce this BlockifyError. Here's a gist to test:

https://gist.github.com/matt-peters/66564e0684bfaf513968

This outputs

Sie verwenden eine veraltete Browserversion. Bitte verwenden Sie eine unterstütze Version damit Sie MSN optimal nutzen können.
MSN Deutschland – mit Hotmail Nachfolger Outlook und Messenger Skype Durch Nutzung dieser Webseite stimmen Sie der Verwendung von Cookies für Analysezwecke, personalisierte Inhalte und Werbung zu. Sie verwenden eine veraltete Browserversion. Bitte verwenden Sie eine unterstütze Version damit Sie MSN optimal nutzen können.

Are you on the latest master branch and do the unit tests pass for you?

saloua-cliqz commented 9 years ago

Actually, I installed dragnet throw pip install.

matt-peters commented 9 years ago

OK - the first thing to do is make sure your install is working properly. Clone from master, install and then run the tests (make test) to ensure they pass. If they do and you are still getting the exception then I'm not sure what else can be done, it's likely some lower level library like libxml2 at that point. If I can't reproduce on my end then there isn't much I can do.

dlecocq commented 9 years ago

The output of pip freeze might be helpful. The difficulty in reproducing this is compounded by the fact that this relies so heavily on extensions and in general has a rather large dependency chain (for, say, libxml2).