<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>robertsahlin.com</title>
	<atom:link href="http://www.robertsahlin.com/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.robertsahlin.com</link>
	<description>Analytics-driven, customer-focused</description>
	<lastBuildDate>Tue, 16 Apr 2013 09:31:38 +0000</lastBuildDate>
	<language>sv-SE</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.5.1</generator>
		<item>
		<title>PUL och molntjänster för analys</title>
		<link>http://www.robertsahlin.com/pul-och-molntjanster-for-analys/</link>
		<comments>http://www.robertsahlin.com/pul-och-molntjanster-for-analys/#comments</comments>
		<pubDate>Tue, 16 Apr 2013 09:31:38 +0000</pubDate>
		<dc:creator>Robert Sahlin</dc:creator>
				<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[Svenska]]></category>
		<category><![CDATA[Webbanalys]]></category>
		<category><![CDATA[azure]]></category>
		<category><![CDATA[hadoop]]></category>
		<category><![CDATA[molntjänster]]></category>
		<category><![CDATA[Personuppgiftslagen]]></category>
		<category><![CDATA[PUL]]></category>

		<guid isPermaLink="false">http://www.robertsahlin.com/?p=827</guid>
		<description><![CDATA[<p>Jag hade intressant samtal med en &#8221;Big Data&#8221;-konsult igår om Hadoop i molnet. Enligt konsulten så får företag som är registrerade i ett land inte föra över personuppgifter till annat land. Konsulten hänvisade till PUL och om det stämmer så &#8230; <a href="http://www.robertsahlin.com/pul-och-molntjanster-for-analys/">Continue reading <span class="meta-nav">&#8594;</span></a></p>
]]></description>
				<content:encoded><![CDATA[<p>Jag hade intressant samtal med en "Big Data"-konsult igår om Hadoop i molnet. Enligt konsulten så får företag som är registrerade i ett land inte föra över personuppgifter till annat land. Konsulten hänvisade till PUL och om det stämmer så har det stor påverkan på möjligheten att nyttja molntjänster eftersom dessa ofta har datacenter i annat land än Sverige samt att kund- och webbanalys ofta inbegriper personuppgifter i form av ID-nummer som indirekt kan kopplas till en person.</p>
<p>Jag var av annan uppfattning/tolkning och utan att vara juridisk expert så tänkte jag återge min tolkning, i synnerhet för att nyttja Azures Hadooptjänst i webbanalyssyfte.</p>
<p><a title="Vad är Personuppgiftslagen" href="http://www.datainspektionen.se/fragor-och-svar/personuppgiftslagen/vad-ar-personuppgiftslagen-och-pul/" target="_blank">PUL</a> förklarat av Datainspektionen:</p>
<blockquote><p>"PuL är en förkortning av personuppgiftslagen. Personuppgiftslagen innehåller regler som ska skydda människor mot att deras personliga integritet kränks genom behandling av personuppgifter. Lagen gäller för behandling av personuppgifter i hela samhället - för verksamhet som bedrivs av såväl myndigheter som enskilda..."</p></blockquote>
<p>Vad är en <a title="Vad är en personuppgift?" href="http://www.datainspektionen.se/fragor-och-svar/personuppgiftslagen/vad-ar-en-personuppgift/">personuppgift</a> enligt Datainspektionen:</p>
<blockquote><p>"All slags information som direkt eller indirekt kan knytas till en fysisk person som är i livet räknas enligt personuppgiftslagen som personuppgifter. Även bilder (foton) och ljudupptagningar på individer som behandlas i dator kan vara personuppgifter även om inga namn nämns. Krypterade uppgifter och <strong>olika slags elektroniska identiteter</strong>, som exempelvis IP-nummer, räknas som personuppgifter om de kan kopplas till fysiska personer."</p></blockquote>
<p>Med andra ord räknas kund-id, order-id, medlemskapsnummer, m.m. som personuppgifter då dessa indirekt kan knytas till en person. Så lagras dessa för analyssyfte så måste företaget leva upp till PUL.</p>
<p>Vilka regler gäller för överföring av <a title="Särskilda regler för överföring till tredje land" href="http://www.datainspektionen.se/fragor-och-svar/personuppgiftslagen/varfor-finns-det-sarskilda-regler-om-tredjelandsoverforing/" target="_blank">personuppgifter till tredje land</a>?</p>
<blockquote><p> "EU:s dataskyddsdirektiv kräver att alla medlemsstater har regler som ger ett likvärdigt skydd för personuppgifter och personlig integritet. Detta gäller även EES-länderna. Därför kan personuppgifter föras över fritt inom detta område utan begränsningar. Eftersom det inte finns några generella regler som ger motsvarande garantier utanför EU/EES har man ansett att överföring till sådana länder bör begränsas. Personuppgifter får därför föras över endast om det finns en adekvat skyddsnivå i mottagarlandet eller om det finns särskilda garantier för att uppgifterna och de registrerades rättigheter skyddas."</p></blockquote>
<p>Med andra ord är det fullt möjligt att nyttja molntjänster baserade i EU för nämnda ändamål. Men för molntjänster i andra länder gäller särskilda regler. Datainspektionen har en <a title="Länder med adekvat skyddsnivå" href="http://www.datainspektionen.se/fragor-och-svar/personuppgiftslagen/mall1/" target="_blank">lista över vilka länder</a> som har adekvat skyddsnivå. Eftersom Microsofts Hadoop-tjänst i dagsläget endast finns tillgänglig i deras amerikanska datacenter (US-North) så gäller Safe Harbor-principerna.</p>
<blockquote><p>Det är en samling frivilliga regler om personlig integritet och dataskydd som har tagits fram och beslutats av USA:s handelsdepartement (Department of Commerce - DoC). Organisationer i USA kan anmäla till departementet att de ansluter sig till dessa regler. EU-kommissionen har bedömt att reglerna (med tillhörande frågor och svar) utgör en adekvat skyddsnivå. Det är därmed tillåtet att föra över personuppgifter från EU/EES till organisationer i USA som har anslutit sig till reglerna. På USA:s handelsdepartements webbplats finns en lista över företag som anslutit sig till Safe Harbor-principerna.</p></blockquote>
<p>I fallet Microsoft Azure så går det att <a title="Microsoft Trust Center - Safe Harbor" href="http://www.windowsazure.com/en-us/support/trust-center/privacy/" target="_blank">läsa att de uppfyller nämnda principer</a>. Jag tolkar sålunda att det är fritt fram att nyttja Azure HDInsight för webbanalys, givet att:</p>
<blockquote><p>"Den personuppgiftsbehandling som sker i Sverige måste fortfarande följa reglerna i personuppgiftslagen. Det innebär att uppgifter bara får föras över om den personuppgiftsansvarige i Sverige har följt övriga krav i personuppgiftslagen, till exempel de grundläggande kraven på personuppgiftsbehandling och reglerna om när sådan behandling över huvud taget är tillåten."</p></blockquote>
]]></content:encoded>
			<wfw:commentRss>http://www.robertsahlin.com/pul-och-molntjanster-for-analys/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Azure HDInsight &#8211; persistent data with blob storage and SQL Server (part 2)</title>
		<link>http://www.robertsahlin.com/azure-hdinsight-persistent-data/</link>
		<comments>http://www.robertsahlin.com/azure-hdinsight-persistent-data/#comments</comments>
		<pubDate>Tue, 02 Apr 2013 14:13:52 +0000</pubDate>
		<dc:creator>Robert Sahlin</dc:creator>
				<category><![CDATA[English]]></category>
		<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[Azure blob storage]]></category>
		<category><![CDATA[Azure SQL Server]]></category>
		<category><![CDATA[hadoop]]></category>
		<category><![CDATA[hdinsight]]></category>
		<category><![CDATA[persistent data]]></category>

		<guid isPermaLink="false">http://www.robertsahlin.com/?p=805</guid>
		<description><![CDATA[<p>So you got access to Azure HDInsight and your usage pattern is such that you don&#8217;t want to run a cluster 24/7? Then you want a persistent data storage both in terms of the data you want to analyse, but &#8230; <a href="http://www.robertsahlin.com/azure-hdinsight-persistent-data/">Continue reading <span class="meta-nav">&#8594;</span></a></p>
]]></description>
				<content:encoded><![CDATA[<p>So you got access to Azure HDInsight and your usage pattern is such that you don't want to run a cluster 24/7? Then you want a persistent data storage both in terms of the data you want to analyse, but also your meta data store. Azure blob storage and SQL Server to the rescue.</p>
<p>When you have signed up for azure blob storage it is time to upload your raw data (your web server log files). The easiest way to do it is by using a Azure blob storage client, I've mostly been using <a title="Cloudberry Azure explorer" href="http://www.cloudberrylab.com/free-microsoft-azure-explorer.aspx" target="_blank">Cloudberry Explorer for Windows Azure</a>. <a title="AZCopy" href="http://blogs.msdn.com/b/windowsazurestorage/archive/2012/12/03/azcopy-uploading-downloading-files-for-windows-azure-blobs.aspx" target="_blank">AZCopy</a> is an alternative I've used when I needed command line access from a Talend job collecting files from a server and compressing those (7zip) before uploading to Azure blob storage. The explorer software is great becuase you can easily create a directory structure with folders and subfolders, you can't do that from the Azure web interface yet (only containers). You want to set up a tier0 folder for your raw data and one or more staging folders (ex. tier1). For production use you want to set up an automatic job to collect your web data, either in a streaming fashion (flume, scribe, etc.), logging directly from your .net web application, scheduled transports of log files or perhaps let enable logging on a gif-object in the blob storage and <a title="azure blob storage log files" href="http://msdn.microsoft.com/en-us/library/windowsazure/hh343259.aspx">analyse those log files</a>. I will have to write a separate post on that.</p>
<p>To access your blob storage containers you <a title="HDInsight and Azure blob storage" href="http://blogs.msdn.com/b/windowsazure/archive/2013/03/21/azure-hdinsight-and-azure-storage.aspx" target="_blank">specify what container to use</a> when setting up your cluster. If you want to access more than one container I advise you to read the <a title="multiple storage accounts" href="http://dennyglee.com/2013/03/25/updated-hdinsight-on-azure-asv-paths-for-multiple-storage-accounts/" target="_blank">excellent post by Denny Lee</a>. But wait, isn't Hadoop all about moving compute to data vs. traditionally moving data to compute, so why should I use blob storage instead of local disk HDFS?  <a title="why blob storage with hdinsight" href="http://dennyglee.com/2013/03/18/why-use-blob-storage-with-hdinsight-on-azure/" target="_blank">Denny Lee describes that as well</a>, in short it is all about the network: the performance of utilizing HDFS with local disk or HDFS using ASV (blob storage) is comparable (if your cluster is smaller than 40 nodes).</p>
<p>The other challenge is to set up persistent storage of meta data. The best option is to use Azure SQL Server for that. In the Hadooponazure.com preview it was straight forward to make that setup when launcing your cluster, but not so in HDInsight feature preview (yet).  Actually, when spinning up a cluster, Azure set up a temporary SQL Server as your meta store behind the scenes. We will set up our own database, prepare it with the correct tables and point the cluster to use that as meta store instead.</p>
<p>1) This step is only necessary the first time you set up your own SQL Server as meta store. Create a Azure SQL Server instance and make a note of server name, database name, user and password. Remote desktop to your HDInsight cluster and open a terminal window. From your terminal window, replace the parameters with yours and run:</p>
<pre>%HIVE_HOME% CreateHiveMetaStoreOnSqlAzure.cmd SERVER_NAME DATABASE_NAME USER PASSWORD %HIVE_HOME%</pre>
<p>Now your SQL Server is populated with the needed tables to run as a hive meta store, make sure to check that the tables are created before moving forward.</p>
<p>2) It is time to point your cluster to your newly created meta store. Locate your hive-site.xml file (C:\apps\dist\hive-0.9.0\conf) and open it. Locate the properties (SERVER_NAME, DATABASE_NAME, USER, PASSWORD) below and change them according to your credentials, (keep a local copy of your new hive-site.xml and copy-replace the next time you spin up your cluster).</p>
<pre>&lt;property&gt;
&lt;name&gt;javax.jdo.option.ConnectionURL&lt;/name&gt;
&lt;value&gt;jdbc:sqlserver://SERVER_NAME.database.windows.net:1433;database=DATABASE_NAME;encrypt=true;trustServerCertificate=true;create=false&lt;/value&gt;
&lt;description&gt;JDBC connect string for a JDBC metastore&lt;/description&gt;
&lt;/property&gt;
&lt;property&gt;
 &lt;name&gt;javax.jdo.option.ConnectionUserName&lt;/name&gt;
 &lt;value&gt;USER@SERVER_NAME&lt;/value&gt;
&lt;/property&gt;
 &lt;property&gt;
 &lt;name&gt;javax.jdo.option.ConnectionPassword&lt;/name&gt;
 &lt;value&gt;PASSWORD&lt;/value&gt;
&lt;/property&gt;</pre>
<p>&nbsp;</p>
<p>Then you likely need to restart your Hive server. Go to the bin folder (C:\apps\dist\hive-0.9.0\bin) and run stop_daemons followed by start_daemons. The easiest way to check if your changes have taken effect is to:</p>
<p>1. Launch your hive client</p>
<pre> %HIVE_HOME%/bin/hive</pre>
<p>2. Create a table</p>
<pre>CREATE EXTERNAL TABLE IF NOT EXISTS campaigns_tier1(
session_id STRING
) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';
</pre>
<p>3. Check if the table exist in your SQL Server database (log in to your sql database management portal).<br />
<a href="http://www.robertsahlin.com/wp-content/uploads/SQL-database-management-portal.png"><img class="aligncenter size-medium wp-image-818" alt="SQL database management portal" src="http://www.robertsahlin.com/wp-content/uploads/SQL-database-management-portal-300x121.png" width="300" height="121" /></a></p>
<p>Now you should have a HDInsight cluster with persistent data and meta data storage. If you have any feedback, questions or tips to further improve the setup, please add a comment.</p>
<p><a title="Azure HDInsight" href="http://www.robertsahlin.com/azure-hdinsight-hadoop-analytics-in-the-cloud-part-1/">If you missed part one on Azure HDInsight.</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.robertsahlin.com/azure-hdinsight-persistent-data/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Azure HDInsight &#8211; Hadoop analytics in the cloud &#8211; part 1</title>
		<link>http://www.robertsahlin.com/azure-hdinsight-hadoop-analytics-in-the-cloud-part-1/</link>
		<comments>http://www.robertsahlin.com/azure-hdinsight-hadoop-analytics-in-the-cloud-part-1/#comments</comments>
		<pubDate>Wed, 27 Mar 2013 11:02:37 +0000</pubDate>
		<dc:creator>Robert Sahlin</dc:creator>
				<category><![CDATA[English]]></category>
		<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[azure]]></category>
		<category><![CDATA[cloud]]></category>
		<category><![CDATA[hadoop]]></category>
		<category><![CDATA[hdinsight]]></category>

		<guid isPermaLink="false">http://www.robertsahlin.com/?p=773</guid>
		<description><![CDATA[<p>This is part 1 in a serie of blog posts about web analytics using Hadoop in the cloud. Why would you like to run your Hadoop cluster in the cloud? Well, there may be several reasons for that. Perhaps you &#8230; <a href="http://www.robertsahlin.com/azure-hdinsight-hadoop-analytics-in-the-cloud-part-1/">Continue reading <span class="meta-nav">&#8594;</span></a></p>
]]></description>
				<content:encoded><![CDATA[<p>This is part 1 in a serie of blog posts about web analytics using Hadoop in the cloud.</p>
<p>Why would you like to run your Hadoop cluster in the cloud? Well, there may be several reasons for that. Perhaps you don't have resources (time, money and skills) to operate a Hadoop cluster inhouse or your demand fluctuates frequently, the arguments are the same as for cloud services in general. The important part when applying this to Hadoop is how to keep your data and meta data when taking down your Hadoop cluster. Also, it is preferable that the service doesn't take to long to spin up your cluster.</p>
<p>I have tried out both <a title="Amazon Elastic Map-reduce" href="http://aws.amazon.com/elasticmapreduce/" target="_blank">Amazon Elastic MapReduce</a> and <a title="Azure HDInsight" href="http://www.windowsazure.com/en-us/manage/services/hdinsight" target="_blank">Azure HDInsight</a>, and I'm impressed by both offerings. However, being more comfortable and experienced with Windows than Linux and working for a company that run pretty much all systems on Microsoft technology (even BI), the choice was never hard when deciding on a service for my Proof of Concept. I look forward to a GA-release of Azure HDInsight to fully recommend it as ready for production use cases.</p>
<p>So, how do you get started? First, apply for the Azure HDInsight feature preview (you need to log in to Azure first), it may take a while to get granted access, so don't wait, just do it. Second, <a title="HDInsight Server" href="http://www.microsoft.com/web/gallery/install.aspx?appid=HDINSIGHT-PREVIEW" target="_blank">download the local HDInsight distribution</a> to start develop on your local machine before throwing your code on a bigger dataset.</p>
<p><a href="http://www.robertsahlin.com/wp-content/uploads/HDInsight-Feature-Preview.png"><img class="aligncenter size-medium wp-image-793" alt="HDInsight Feature Preview" src="http://www.robertsahlin.com/wp-content/uploads/HDInsight-Feature-Preview-300x139.png" width="300" height="139" /></a></p>
<p>If you don't already have a good use case for your Big data/Hadoop pilot I suggest that you start analysing your web logs. Reason, even if you don't have tens of TB:s in web logs, the data is of such nature that it suits well for practicing development and analysis on Hadoop. The data doesn't change once it is written and it is pretty easy to transport and parse. Also, in most businesses nowadays, the web presence is a crucial part of business. That use case may even be your Trojan Horse to get a Hadoop implementation through the Finance department as some web analytics solutions are rediculously overpriced data collection tools. Cost savings usually serves as a stronger argument than strategic objectives, perhaps there is som truth in "it is easier to save a buck than earning one". Example, it is not unusual that a proprietary web analytics SAAS solution may cost 200 000 USD annually. That is approximate what you would pay for a 25-30 node cluster running 24/7, and that is a lot of computing power for a standard web analytics implementation at a medium/large company.</p>
<p>I strongly suggest you get your hands on "Programming Hive" and "Programming Pig" to accompany you on your big data journey. If you are interested in operating a Hadoop cluster inhouse, then "Hadoop - the definitive guide" is probably a good investment as well.</p>
<p>But this blog serie will focus on Hadoop in the cloud or more specifically:</p>
<ul>
<li>- Azure HDInsight as Hadoop compute cluster</li>
<li>- <a title="Azure Blob Storage" href="http://www.windowsazure.com/en-us/manage/services/storage/" target="_blank">Azure Blob storage</a> for persistent data storage</li>
<li>- <a title="Azure SQL Server" href="http://www.windowsazure.com/en-us/manage/services/sql-databases/" target="_blank">Azure SQL Server</a> as persistent metastore</li>
<li>- Excel PowerPivot and PowerView as analytics frontend</li>
<li>- <a title="Apache Pig" href="http://pig.apache.org/" target="_blank">Pig</a> for data processing/enhancement</li>
<li>- hCatalog for meta data management</li>
<li>- <a title="Apache Hive" href="http://hive.apache.org/" target="_blank">Hive</a> for analysis</li>
</ul>
<p>Please, comment, <a title="LinkedIn" href="http://se.linkedin.com/in/robertsahlin" target="_blank">connect</a> or <a title="send" href="mailto:robert.sahlin@gmail.com">send</a> me a message if you have feedback or questions. Let the big data journey begin.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.robertsahlin.com/azure-hdinsight-hadoop-analytics-in-the-cloud-part-1/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Hadoop Summit 2013 dag 2</title>
		<link>http://www.robertsahlin.com/hadoop-summit-2013-dag-2/</link>
		<comments>http://www.robertsahlin.com/hadoop-summit-2013-dag-2/#comments</comments>
		<pubDate>Thu, 21 Mar 2013 20:48:20 +0000</pubDate>
		<dc:creator>Robert Sahlin</dc:creator>
				<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[Svenska]]></category>
		<category><![CDATA[hadoop]]></category>
		<category><![CDATA[Hadoop Summit]]></category>
		<category><![CDATA[maskininlärning]]></category>

		<guid isPermaLink="false">http://www.robertsahlin.com/?p=759</guid>
		<description><![CDATA[<p>Eric Baldeschwieler berättar om både Hadoop och Hortonworks. Får intrycket att Cloudera är störst men att Hortonworks har större momentum, plus att de har en mycket mer tilltalande affärsmodell ur ett kundperspektiv. I den stabila versionen av Hadoop 2.0 så &#8230; <a href="http://www.robertsahlin.com/hadoop-summit-2013-dag-2/">Continue reading <span class="meta-nav">&#8594;</span></a></p>
]]></description>
				<content:encoded><![CDATA[<p><span style="color: #333333; font-family: Georgia, 'Times New Roman', 'Bitstream Charter', Times, serif;">Eric Baldeschwieler berättar om både <a title="Hadoop" href="http://hadoop.apache.org/" target="_blank">Hadoop</a> och Hortonworks. Får intrycket att <a title="Cloudera" href="http://www.cloudera.com" target="_blank">Cloudera</a> är störst men att <a title="Hortonworks" href="http://hortonworks.com/" target="_blank">Hortonworks</a> har större momentum, plus att de har en mycket mer tilltalande affärsmodell ur ett kundperspektiv. I den stabila versionen av Hadoop 2.0 så kommer map-reduce vara ett av flera sätt att bearbeta data och responstiden kommer minska drastiskt och vi kommer få se mer SQL-liknande interaktioner.</span><span> Eric förkunnar att "<span style="color: #333333; font-family: Georgia, 'Times New Roman', 'Bitstream Charter', Times, serif;">Hortonworks Data Platform v 2.0 alpha released today".</span></span></p>
<p><span style="color: #333333; font-family: Georgia, 'Times New Roman', 'Bitstream Charter', Times, serif;">Därefter en intressant paneldiskussion m representanter från eBay, HSBC och Neustar. Samtliga berättar om den stora besparingen i kostnad/TB som Hadoop möjliggör och att det varit avgörande för införandet av Hadoop i stor skala. Det bekräftar att besparingen är den "trojanska hästen" för att få go på en Hadoop-implementation i ett företag även om det finns många andra vinster och strategiska skäl till att implementera Hadoop, men de är svårare att få igenom finansavdelningen. Panelens önskelista: data governance, direct access to production cluster from IDE, interactive queries, easier to operate and maintain clusters to reduce OPEX.</span></p>
<p><span style="color: #333333; font-family: Georgia, 'Times New Roman', 'Bitstream Charter', Times, serif;">Panelens råd: </span><br />
<span style="color: #333333; font-family: Georgia, 'Times New Roman', 'Bitstream Charter', Times, serif;">- Just give hadoop a try and get hands-on experience.</span><br />
<span style="color: #333333; font-family: Georgia, 'Times New Roman', 'Bitstream Charter', Times, serif;">- Test, start small and grow as you learn.</span><br />
<span style="color: #333333; font-family: Georgia, 'Times New Roman', 'Bitstream Charter', Times, serif;">- Be brave and trust your engineers, let them take risks to figure out solutions to issues.</span></p>
<p><span style="color: #333333; font-family: Georgia, 'Times New Roman', 'Bitstream Charter', Times, serif;">Därefter blev det 3 sessioner med maskininlärning. Först ut var Ted Dunning som visade hur man med Hadoop + Mahout + Solr ganska enkelt kan applicera maskininlärning på Big Data för att skapa rekommendationer. Därefter visade Datameer hur man skapar linjära modeller i Hadoop mha deras verktyg, såg smidigt ut om man är beredd att investera tid och pengar i ytterligare ett verktyg. Därefter var det dags för en av de sessioner jag sett fram emot mest, "Scaling big data mining infrastructure" av <a title="Jimmy Lin on Twitter" href="http://twitter.com/lintool" target="_blank">Jimmy Lin</a> (Twitter). Jag blev inte besviken, om jag blir hälften så bra data scientist är jag helnöjd. Jimmy gav många bra tips på vad man bör göra för att undvika att lägga massor av tid på "data cleansing" och istället fokusera på data mining. Dessutom visade han hur man kan använda Pig för maskininlärning med modeller som baseras på SGD, det mesta också beskrivet <a title="Large scale machine learning at Twitter" href="http://www.umiacs.umd.edu/~jimmylin/publications/Lin_Kolcz_SIGMOD2012.pdf" target="_blank">här (PDF)</a>.</span><span style="color: #333333; font-family: Georgia, 'Times New Roman', 'Bitstream Charter', Times, serif;"> </span></p>
<div id="attachment_762" class="wp-caption aligncenter" style="width: 310px"><a href="http://www.robertsahlin.com/wp-content/uploads/IMG_09231.jpg"><img class="size-medium wp-image-762" title="Jimmy Lin HS2013" src="http://www.robertsahlin.com/wp-content/uploads/IMG_09231-300x225.jpg" alt="" width="300" height="225" /></a><p class="wp-caption-text">Jimmy Lin HS2013</p></div>
<p><span style="color: #333333; font-family: Georgia, 'Times New Roman', 'Bitstream Charter', Times, serif;">Sista sessionen jag gick på var <a title="HDInsight on Azure" href="http://www.windowsazure.com/en-us/manage/services/hdinsight/" target="_blank">HDInsight on Azure</a>, Microsofts molntjänst för Hadoop. Visst, det fattas en del saker och man vill ju gärna se en GA-release med SLA innan man kör sitt produktionskluster i Azure. Men det ser lovande ut, kan nog vara språngbrädan för Hadoop som pilotprojekt i enterprisesegmentet. Hoppas det inte dröjer för länge.</span></p>
<p><span style="color: #333333; font-family: Georgia, 'Times New Roman', 'Bitstream Charter', Times, serif;">Ser fram emot att ta del av de inspelade sessionerna, för det var svårt att välja spår emellanåt.</span></p>
<p>För dig som läser och är intresserad av Hadoop kan jag varmt rekommendera Hadoop Summit till nästa år. Hoppas verkligen att jag får se fler från Sverige nästa år. Hör gärna av dig om du vill prata Hadoop, ffa data mining och analys av stort data.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.robertsahlin.com/hadoop-summit-2013-dag-2/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Hadoop Summit 2013 Dag 1</title>
		<link>http://www.robertsahlin.com/hadoop-summit-2013-dag-1/</link>
		<comments>http://www.robertsahlin.com/hadoop-summit-2013-dag-1/#comments</comments>
		<pubDate>Wed, 20 Mar 2013 17:17:14 +0000</pubDate>
		<dc:creator>Robert Sahlin</dc:creator>
				<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[Svenska]]></category>
		<category><![CDATA[hadoop]]></category>
		<category><![CDATA[Hadoop Summit]]></category>
		<category><![CDATA[konferens]]></category>

		<guid isPermaLink="false">http://www.robertsahlin.com/?p=749</guid>
		<description><![CDATA[<p>Hadoop Summit 2013 dag 1 är över, eller inte riktigt, vi ska till Heineken Experience Center ikväll också. Hur sammanfattar man dagen? Fina faciliteter som andas historia, 500 besökare och lovande start vad gäller presentationer. Gillade särskilt Shaun Connollys key &#8230; <a href="http://www.robertsahlin.com/hadoop-summit-2013-dag-1/">Continue reading <span class="meta-nav">&#8594;</span></a></p>
]]></description>
				<content:encoded><![CDATA[<p>Hadoop Summit 2013 dag 1 är över, eller inte riktigt, vi ska till Heineken Experience Center ikväll också. Hur sammanfattar man dagen? Fina faciliteter som andas historia, 500 besökare och lovande start vad gäller presentationer. Gillade särskilt Shaun Connollys key note "Hadoops role in the enterprise architecture", något jag tror många CIOs borde fundera på. Kul att några av de vassaste på Hadoop är här och presenterar, ex. <span style="color: #333333; font-family: Georgia, 'Times New Roman', 'Bitstream Charter', Times, serif;">Allen Wittenauer (LinkedIn), Eric Baldeschwieler (Hortonworks), Ted Dunning (MapR) och Jimmy Lin (Twitter)</span>.</p>
<p>I dagens första key note fick vi bl.a. se statistik på hur efterfrågan på Hadoop-kompetens utvecklats senaste tre åren i jmf med DW/BI-kompetens och de råder ingen tvekan om den utvecklingen. Bekymmersamt är hur långt efter Europa är i jmf. ffa USA men också Asien mätt i antal linkedIn-medlemmar som uppger att de arbetar med Hadoop. Och då ska vi inte prata om Sverige på den kartan. Faktum är att av 500 deltagare så uppskattar jag att vi är 3-4 st på plats som arbetar i Sverige. En av dem är Johan Pettersson som jag hade chans att prata med en stund, vilket var både trevligt och lärorikt. Han är en av få verksamma i Sverige som kan säga att han utvecklat en stor Hadoop-lösning från grunden (King.com, samlar ca. 3 miljarder rader om dagen).</p>
<p>Nu ska jag bege mig till Heineken EC, rapporterar om dag 2 imorn.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.robertsahlin.com/hadoop-summit-2013-dag-1/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Google Tag Manager on WordPress</title>
		<link>http://www.robertsahlin.com/google-tag-manager-on-wordpress/</link>
		<comments>http://www.robertsahlin.com/google-tag-manager-on-wordpress/#comments</comments>
		<pubDate>Thu, 06 Dec 2012 20:32:20 +0000</pubDate>
		<dc:creator>Robert Sahlin</dc:creator>
				<category><![CDATA[English]]></category>
		<category><![CDATA[Webbanalys]]></category>
		<category><![CDATA[Data Layer]]></category>
		<category><![CDATA[Google analytics]]></category>
		<category><![CDATA[Google Tag Manager]]></category>
		<category><![CDATA[JSON]]></category>
		<category><![CDATA[Wordpress]]></category>

		<guid isPermaLink="false">http://www.robertsahlin.com/?p=551</guid>
		<description><![CDATA[<p>Well, a WordPress site that you host yourself is not perhaps the kind of site where you benefit most from using Google Tag Manager (GTM). However, it is a great way to learn and try out GTM without the risk &#8230; <a href="http://www.robertsahlin.com/google-tag-manager-on-wordpress/">Continue reading <span class="meta-nav">&#8594;</span></a></p>
]]></description>
				<content:encoded><![CDATA[<p>Well, a WordPress site that you host yourself is not perhaps the kind of site where you benefit most from using Google Tag Manager (GTM). However, it is a great way to learn and try out GTM without the risk of negative impact on your e-commerce site. In order to fully utilize GTM for Google Analytics, you need a data layer. WordPress doesn't provide a data layer as a JSON-array as default so you have to create one (I couldn't find any plugin at the time writing). I could probably have written a plugin for this but I didn't have the time to figure out how.</p>
<p>First, find the functions.php in your theme. Add the following function in it:</p>
<pre>if ( !function_exists( 'before_tag_manager' ) ) {
function before_tag_manager() { 
global $query_string, $post;
$post_id = $post-&gt;ID;
 if( have_posts() ) : 
 while( have_posts() ) : the_post();
 $output[]= array( 'title' =&gt; get_the_title(), 'date' =&gt; get_the_date());
 endwhile;
 endif;
 if(isset($output)){ 
 echo "&lt;script&gt;dataLayer =" . json_encode($output) . "&lt;/script&gt;";
 }
 }
} // endif</pre>
<p>Then you need to add the function call to your theme's header template (usually header.php). Locate the body start tag and add the function call immediately after that, then add the GTM-script:</p>
<pre>&lt;/head&gt;
&lt;body &lt;?php body_class(); ?&gt;&gt;
&lt;?php before_tag_manager(); ?&gt;
&lt;!-- Google Tag Manager --&gt;
&lt;noscript&gt;&lt;iframe src="//www.googletagmanager.com/ns.html?id=GTM-9Q8B"
height="0" width="0" style="display:none;visibility:hidden"&gt;&lt;/iframe&gt;&lt;/noscript&gt;
&lt;script&gt;(function(w,d,s,l,i){w[l]=w[l]||[];w[l].push({'gtm.start':
new Date().getTime(),event:'gtm.js'});var f=d.getElementsByTagName(s)[0],
j=d.createElement(s),dl=l!='dataLayer'?'&amp;l='+l:'';j.async=true;j.src=
'//www.googletagmanager.com/gtm.js?id='+i+dl;f.parentNode.insertBefore(j,f);
})(window,document,'script','dataLayer','&lt;YOUR CONTAINER ID&gt;');&lt;/script&gt;
&lt;!-- End Google Tag Manager --&gt;</pre>
<p>If you want to play with other variables in the data layer than "title" and "date", you can easily add context by using the built in template tags in wordpress and put them in the $output variable in the before_tag_manager function call. If you view the source code on one of your blog posts you will now see a dataLayer containing both the "title" and "date" of the post. The variables are now easily accessed from the Google Tag Manager Macros as Data Layer variables.</p>
<div id="attachment_556" class="wp-caption aligncenter" style="width: 310px"><a href="http://www.robertsahlin.com/wp-content/uploads/datalayer.png"><img class="size-medium wp-image-556" title="datalayer" src="http://www.robertsahlin.com/wp-content/uploads/datalayer-300x189.png" alt="" width="300" height="189" /></a><p class="wp-caption-text">Google Tag Manager - Data Layer</p></div>
]]></content:encoded>
			<wfw:commentRss>http://www.robertsahlin.com/google-tag-manager-on-wordpress/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Guide till Hadoop &#8211; Windows, Elastic Map Reduce och Pig</title>
		<link>http://www.robertsahlin.com/guide-till-hadoop-windows-elastic-map-reduce-och-ig/</link>
		<comments>http://www.robertsahlin.com/guide-till-hadoop-windows-elastic-map-reduce-och-ig/#comments</comments>
		<pubDate>Tue, 05 Jun 2012 15:04:23 +0000</pubDate>
		<dc:creator>Robert Sahlin</dc:creator>
				<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[Svenska]]></category>

		<guid isPermaLink="false">http://www.robertsahlin.com/?p=202</guid>
		<description><![CDATA[<p>Jag tänkte jag skulle skriva ner de första stegen för att komma igång med Hadoop på en windows-dator. Enklast är att köra ett Hadoop-kluster i molnet med hjälp av Amazons Elastic Map Reduce som sköter mycket av det tekniska med &#8230; <a href="http://www.robertsahlin.com/guide-till-hadoop-windows-elastic-map-reduce-och-ig/">Continue reading <span class="meta-nav">&#8594;</span></a></p>
]]></description>
				<content:encoded><![CDATA[<p>Jag tänkte jag skulle skriva ner de första stegen för att komma igång med <a title="Apache Hadoop" href="http://hadoop.apache.org/" target="_blank">Hadoop</a> på en windows-dator. Enklast är att köra ett Hadoop-kluster i molnet med hjälp av <a title="Amazon Elastic Map Reduce" href="http://aws.amazon.com/elasticmapreduce/" target="_blank">Amazons Elastic Map Reduce</a> som sköter mycket av det tekniska med att starta upp och administrera ett Hadoop-kluster och låter användaren fokusera på nyttjandet av Hadoop. Ett annat alternativ är att köra exempelvis <a title="Cloudera Downloads" href="https://ccp.cloudera.com/display/SUPPORT/Downloads" target="_blank">Clouderas distribution</a> via <a title="VM-ware" href="http://www.vmware.com/se/products/desktop_virtualization/player/overview.html" target="_blank">VM-ware</a>, men det kräver en del hårdvaruprestanda (<a title="Kom igång med Hadoop (lokal installation)" href="http://www.robertsahlin.com/kom-igang-med-hadoop/">läs mer</a>). Så jag tänkte fokusera det förstnämnda alternativet och visa hur man startar igång ett interaktivt Pig job på Amazon Elastic Map Reduce. Vill du veta mer om <a title="Apache Pig" href="http://pig.apache.org/" target="_blank">Pig så läs här</a> men kortfattat/förenklat är det ett slags skript-språk som låter användaren fokusera på processandet av data utan att behöva skriva kod för mapreduce.</p>
<p><strong>1.</strong> <a title="Sign up Amazon" href="https://aws-portal.amazon.com/gp/aws/developer/registration" target="_blank">Skaffa ett konto hos Amazon</a>.</p>
<p><strong>2.</strong> Sätt upp SSH antingen med <a title="Download Cygwin" href="http://www.cygwin.com/" target="_blank">Cygwin</a> eller <a title="Download PuTTY" href="http://www.chiark.greenend.org.uk/~sgtatham/putty" target="_blank">PuTTY</a> (jag föredrar PuTTY). Du måste<a title="Nedladdning PuTTY och PuTTYgen" href="http://www.chiark.greenend.org.uk/~sgtatham/putty/download.html" target="_blank"> ladda ner</a>  PuTTY och PuTTYgen. Gå därefeter in på <a href="http://console.aws.amazon.com/ec2/home" target="_blank">http://console.aws.amazon.com/ec2/home</a> och logga in. Klicka på "Amazon Elastic EC2" i huvudmenyn. Välj region (antagligen Europa om du läser detta). Klicka därefter på länken "Key Pairs" och sedan på knappen "Create Key Pair". Spara filen. Starta PuTTYgen, välj "Load" och leta upp filen du precis sparade (PuTTY visar bara filer av typen *.ppk default så välj "All Files" för att se din .pem-fil). Välj din fil och klicka på "Open" och du bör få ett meddelande att PuTTYgen lyckats importera nyckeln men att du måste spara nyckeln i PuTTYs egna format. Så välj "Save private key" och PuTTY kommer fråga om du vill spara nyckeln utan passphrase, välj "Yes". Spara filen med samma namn på .pem-filen och PuTTY kommer automatiskt lägga till filändelsen .ppk. Nu har din nyckel rätt format för att kunna använda PuTTYs SSH-klient för koppla upp dig mot Amazon EMR.</p>
<p><strong>3.</strong> <a href="http://console.aws.amazon.com/elasticmapreduce/home" target="_blank">Gå till http://console.aws.amazon.com/elasticmapreduce/home</a> (logga in om du behöver det). Klicka på MapReduce i huvudmenyn och välj "Create New Job Flow". Skriv in ett namn på ditt job flow och välj "Pig Program" som typ av job. "Continue". Välj "Start an Interactive Pig Session". En interaktiv Pig session är lämpligast om man vill köra analys ad-hoc, utforma skript eller köra flera olika jobb utan att stänga ner Hadoop-klustret däremellan. "Continue". I nästa steg väljer du hur många noder/instanser du vill starta upp i klustret. Välj small som master, 1 small core och 0 task. "Continue". Här väljer du det EC2-nyckelpar du precis skapat och strunta i VPC subnet och loggningen denna gång. "Continue". I det här steget kan du välja att köra Bootstrap Actions för att anpassa konfigurationen eller installera särskild mjukvara innan du startar ditt jobflow. Men det ska vi inte göra denna gång. "Continue". Kolla igenom att dina val stämmer. "Continue". Nu tar det några minuter innan ditt Hadoop-kluster är redo för att köra dina jobb. Kom ihåg att manuellt avsluta ditt kluster när du är klar, annars kommer Amazon debitera dig för varje maskintimme som klustret är uppe, oavsett om det kör några jobb eller inte. Du avslutar klustret genom att markera aktuellt jobb i managementkonsolen och välja "Terminate".</p>
<p><strong>4.</strong> När det gått några minuter kan du klicka på ditt job flow i managementkonsolen och skrolla ner i det nedre detaljfönstret tills du ser Master Public DNS Name. Kopiera det. Starta PuTTY, klistra in ditt Master Public DNS Name som Host Name, välj SSH&gt;Auth, klicka på "Browse" och leta upp och välj din ppk-fil du skapade tidigare m.h.a. PuTTYgen. Välj "Open" och det startar en kommando-promt samt en alertruta som frågar om du litar på den host du kopplar upp dig mot, välj "Yes". Kommando-prompten kommer be dig att logga in, använd användarnamnet "hadoop". Du är nu uppkopplad mot masternoden i ditt Hadoop-kluster.</p>
<p><strong>5.</strong> För att köra en interaktiv Pig-session så startar du kommandoprompten (heter passande nog Grunt) genom att helt enkelt skriva "Pig".</p>
<pre>grunt&gt;</pre>
<p>Pig stödjer kommandona "pwd", "cd", "ls" and "cp" för att interagera med filsystemet. Du kan enkelt byta katalog till en av dina buckets på S3 där du kanske sparat upp de datafiler du önskar bearbeta eller analysera.</p>
<pre>grunt&gt; cd s3://&lt;bucket&gt;/&lt;folder&gt;
grunt&gt; ls</pre>
<p>Hur du laddar upp filer till S3 lämnar jag utanför den här guiden. Den finns tonvis med guider och verktyg för att underlätta det arbetet.</p>
<p>Ofta när man arbetar med Pig så vill man använda funktioner som finns i ett tilläggsbibliotek av öppen källkod för Pig som kalla Piggybank. Elastic MapReduce kopierar Piggybank till noderna när den sätter upp Pig. För att kunna använda de funktionerna så måste du för registrera jar-filen genom att skriva:</p>
<pre>grunt&gt; register file:/home/hadoop/lib/pig/piggybank.jar</pre>
<p>För att ladda in data rad för rad som egna element så kan man använda TextLoader.</p>
<pre>grunt&gt; RAW_DATA = LOAD 's3://&lt;bucket&gt;/&lt;folder&gt;/&lt;file&gt;' USING TextLoader as (line:chararray);</pre>
<p>Vill du ladda in alla filer under en viss folder så utelämnar du bara &lt;file&gt;.</p>
<p>Nu har du startat upp ett Hadoop-kluster i ett interaktivt Pig-läge och du har laddat upp data som du kan börja analysera, men det låter jag dig själv experimentera med.</p>
<p>Användbart på vägen är <a title="Amazons guider till Hadoop" href="http://aws.amazon.com/search?searchQuery=hadoop&amp;searchPath=articles&amp;x=0&amp;y=0" target="_blank">Amazons egna guider</a>, <a title="Cloudera Hadoop Training Resources" href="http://www.cloudera.com/resources/training/" target="_blank">Clouderas instruktionsvideos</a>, <a title="Apache Pig Wiki" href="https://cwiki.apache.org/confluence/display/PIG/Index" target="_blank">wiki för Apache Pig</a> samt <a title="Oreilly Programming Pig" href="http://ofps.oreilly.com/titles/9781449302641/" target="_blank">O'Reillys ofps Programming Pig</a>.</p>
<p>Lycka till!</p>
]]></content:encoded>
			<wfw:commentRss>http://www.robertsahlin.com/guide-till-hadoop-windows-elastic-map-reduce-och-ig/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Tänk igenom din webbenkät i förväg</title>
		<link>http://www.robertsahlin.com/tank-igenom-din-webbenkat-i-forvag/</link>
		<comments>http://www.robertsahlin.com/tank-igenom-din-webbenkat-i-forvag/#comments</comments>
		<pubDate>Mon, 04 Jun 2012 07:33:53 +0000</pubDate>
		<dc:creator>Robert Sahlin</dc:creator>
				<category><![CDATA[Svenska]]></category>
		<category><![CDATA[Webbanalys]]></category>

		<guid isPermaLink="false">http://www.robertsahlin.com/?p=220</guid>
		<description><![CDATA[<p>Idag skulle jag göra en adressändring och gick följaktligen in på www.adressandring.se. Väl där blev jag lite överraskad av att det första jag möttes av var en inbjudan till en webbenkät. Ok, inte helt ovanligt men låt se om de &#8230; <a href="http://www.robertsahlin.com/tank-igenom-din-webbenkat-i-forvag/">Continue reading <span class="meta-nav">&#8594;</span></a></p>
]]></description>
				<content:encoded><![CDATA[<p>Idag skulle jag göra en adressändring och gick följaktligen in på <a title="Svensk adressändring" href="www.adressandring.se" target="_blank">www.adressandring.se</a>. Väl där blev jag lite överraskad av att det första jag möttes av var en inbjudan till en webbenkät. Ok, inte helt ovanligt men låt se om de tänkt igenom sin enkät, det kan ju handla om uppfattning av varumärke etc. som inte har så mycket med mitt besök att göra. Så jag klickar att jag vill svara på enkäten och vad är den första frågan:</p>
<p><a href="http://www.robertsahlin.com/wp-content/uploads/adressandring.png"><img class="aligncenter size-medium wp-image-221" title="adressandring" src="http://www.robertsahlin.com/wp-content/uploads/adressandring-300x240.png" alt="" width="300" height="240" /></a></p>
<p>"Det är lätt att hitta det man söker på den här webbplatsen?". Det är ju onekligen lite svårt att svara på när man precis anlänt och och den enda action man hunnit ta är att man vill svara på enkäten. De skriver iofs att man ska "hoppa över frågan om man ej har erfarenhet av och/eller kan bedöma - hoppa över det". Men varför trigga en enkät på första sidvisningen om den innehåller den här typen av frågor? Om du vill göra en webbplatsundersökning och enkätverktyget inte erbjuder möjlighet att styra triggning av enkät antingen efter ett visst antal sidvisningar, antal besök eller on exit så är det dags att byta enkätverktyg. Allra helst bör enkätverktyget också integrera med webbanalysverktyget så att det går att samköra webbstatistik (kvantitativ data) med enkätsvar (kvalitativ data) för att identifiera segment och skillnader dem emellan.</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://www.robertsahlin.com/tank-igenom-din-webbenkat-i-forvag/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Produktkonvertering offline</title>
		<link>http://www.robertsahlin.com/produktkonvertering-offline/</link>
		<comments>http://www.robertsahlin.com/produktkonvertering-offline/#comments</comments>
		<pubDate>Tue, 22 May 2012 06:54:42 +0000</pubDate>
		<dc:creator>Robert Sahlin</dc:creator>
				<category><![CDATA[Svenska]]></category>
		<category><![CDATA[Webbanalys]]></category>
		<category><![CDATA[offline]]></category>
		<category><![CDATA[produktkonvertering]]></category>
		<category><![CDATA[produktsök]]></category>
		<category><![CDATA[qr-kod]]></category>

		<guid isPermaLink="false">http://www.robertsahlin.com/?p=217</guid>
		<description><![CDATA[<p>En kollega berättade om att han nyligen var i en Brio-butik i Norge för att köpa en present till sin dotter. I butiken satt det inte prislappar på varorna utan de hade istället prisscanners utplacerade på hyllorna, så ville man &#8230; <a href="http://www.robertsahlin.com/produktkonvertering-offline/">Continue reading <span class="meta-nav">&#8594;</span></a></p>
]]></description>
				<content:encoded><![CDATA[<p>En kollega berättade om att han nyligen var i en Brio-butik i Norge för att köpa en present till sin dotter. I butiken satt det inte prislappar på varorna utan de hade istället prisscanners utplacerade på hyllorna, så ville man se priset på en vara så använder man prisscannern. Kanske inte helt optimalt ur ett kundupplevelseperspektiv, men det ger möjlighet till en hel del intressant analys och optimeringsmöjligheter.</p>
<p>Jag vet inte alls hur denna information används men det skulle kunna nyttjas för både prissättning och produktplacering på samma sätt som en e-butik. Om man loggar produktscanningar (istället för produktsökningar eller produktvisningar) och ställer det i relation till antalet köp av samma varor så får man ett ganska intressant underlag både vad gäller exponeringen av varan men också konverteringsgraden. Rätt använd kan den här informationen vara vägledande i både produktplacering (vilken hylla och var på hyllan) och prissättning (höj eller sänk pris beroende på konverteringsgrad).</p>
<p>Om man skulle ta det hela ändå lite längre skulle varje butiksbesökare kunna scanna QR-koder på hyllorna istället för att hämta scanners. Då skulle man kunna göra intressanta analyser om vilka varor som scannas av samma användare (dvs. Association rule learning) eller erbjuda personliga rabatter eller erbjudanden.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.robertsahlin.com/produktkonvertering-offline/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Google analytics conference Stockholm maj 2012</title>
		<link>http://www.robertsahlin.com/google-analytics-conference-stockholm-maj-2012/</link>
		<comments>http://www.robertsahlin.com/google-analytics-conference-stockholm-maj-2012/#comments</comments>
		<pubDate>Tue, 08 May 2012 15:29:42 +0000</pubDate>
		<dc:creator>Robert Sahlin</dc:creator>
				<category><![CDATA[Svenska]]></category>
		<category><![CDATA[Webbanalys]]></category>
		<category><![CDATA[Google analytics]]></category>
		<category><![CDATA[konferens]]></category>

		<guid isPermaLink="false">http://www.robertsahlin.com/?p=207</guid>
		<description><![CDATA[<p>Så var konferensen slut och jag kan sammanfatta det som en blandning av högt och lågt, där representanterna från Google var höjdpunkterna. Kundcasen kändes tyvärr lite för &#8221;enkla&#8221; för att vara matnyttiga, vet inte om det beror på att det &#8230; <a href="http://www.robertsahlin.com/google-analytics-conference-stockholm-maj-2012/">Continue reading <span class="meta-nav">&#8594;</span></a></p>
]]></description>
				<content:encoded><![CDATA[<p>Så var konferensen slut och jag kan sammanfatta det som en blandning av högt och lågt, där representanterna från Google var höjdpunkterna.</p>
<p>Kundcasen kändes tyvärr lite för "enkla" för att vara matnyttiga, vet inte om det beror på att det var case som skulle marknadsföra konsulterna och därav ett snävt utbud, att företagen inte vill avslöja sina bästa case eller att webbanalysmognaden generellt är låg i Sverige.</p>
<p>Slående var att ingen av kundföretagens representanter presenterade sig som webbanalytiker, det var webbdesigner, webbutvecklare och ansvarig för digitala kanaler... Men det kanske är helt naturligt då de tar hjälp av konsultbolag. Jag hade nog iaf förväntat mig försäljningsansvarig/e-commerce manager. Dessvärre är det nog inte många av deltagarna som har webb/data/kund/digital analys som sin huvuduppgift (även om de önskar det) utan är något som ska skötas vid sidan av andra huvuduppgifter.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.robertsahlin.com/google-analytics-conference-stockholm-maj-2012/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
