<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Kryptoblog &#187; CUDA</title>
	<atom:link href="http://www.strombergson.com/kryptoblog/tag/cuda/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.strombergson.com/kryptoblog</link>
	<description>Kryptografi och IT-säkerhet på svenska</description>
	<lastBuildDate>Thu, 20 Jan 2011 21:25:55 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0.4</generator>
<atom:link rel="hub" href="http://pubsubhubbub.appspot.com"/><atom:link rel="hub" href="http://superfeedr.com/hubbub"/>		<item>
		<title>CUDA på Mac</title>
		<link>http://www.strombergson.com/kryptoblog/2009/03/16/cuda-pa-mac/</link>
		<comments>http://www.strombergson.com/kryptoblog/2009/03/16/cuda-pa-mac/#comments</comments>
		<pubDate>Mon, 16 Mar 2009 16:22:39 +0000</pubDate>
		<dc:creator>Joachim Strömbergson</dc:creator>
				<category><![CDATA[Hårdvara]]></category>
		<category><![CDATA[Krypto]]></category>
		<category><![CDATA[Mac]]></category>
		<category><![CDATA[Verktyg]]></category>
		<category><![CDATA[CUDA]]></category>
		<category><![CDATA[HW]]></category>

		<guid isPermaLink="false">http://strombergson.com/kryptoblog/?p=636</guid>
		<description><![CDATA[<p>Jag har nyligen blivit med en ny laptop, en Apple MacBook Unibody:</p>

	<p><img src="http://images.apple.com/euro/macbook/images/specs_display20081014.jpg" alt="MacBook" /></p>

	<p>F&#246;rutom mer minne och st&#246;rre h&#229;rddisk, vilket g&#246;r det l&#228;ttare att k&#246;ra de virtuella system jag anv&#228;nder vid h&#229;rdvaruutveckling kommer maskinen med praktiska funktioner som bakgrundsbelyst&#8230;</p>


No related posts.

Related posts brought to you by <a href='http://mitcho.com/code/yarpp/'>Yet Another Related Posts Plugin</a>.]]></description>
			<content:encoded><![CDATA[	<p>Jag har nyligen blivit med en ny laptop, en Apple MacBook Unibody:</p>

	<p><img src="http://images.apple.com/euro/macbook/images/specs_display20081014.jpg" alt="MacBook" /></p>

	<p>F&#246;rutom mer minne och st&#246;rre h&#229;rddisk, vilket g&#246;r det l&#228;ttare att k&#246;ra de virtuella system jag anv&#228;nder vid h&#229;rdvaruutveckling kommer maskinen med praktiska funktioner som bakgrundsbelyst tangentbord (iaf praktiskt om man sitter uppe p&#229; n&#228;tterna.)</p>

	<p>En annan bra sak med den nya laptopen &#228;r att den kommer med en grafikprocessor (GPU) fr&#229;n Nvidia kapabel att st&#246;dja Nvidias programmeringsmilj&#246; <a href="http://www.nvidia.com/object/cuda_home.html"><span class="caps">CUDA</span></a>. <a href="http://en.wikipedia.org/wiki/CUDA">Compute Unified Device Architecture (CUDA)</a> g&#246;r det m&#246;ligt att relativt enkelt accelerera applikationer med dataparallellism genom att exekvera ber&#228;kningar parallellt p&#229; grafikprocessorn.</p>

	<p>Jag testade att installera <span class="caps">CUDA 2</span>.0 p&#229; laptopen f&#246;rra veckan. Installationen gick i stort sett utan n&#229;gra problem alls, speciellt efter att ha hittat <a href="http://raymondtay.blogspot.com/2009/02/getting-started-with-cuda-20.html">den h&#228;r utm&#228;rkta bloggpostningen om att installera <span class="caps">CUDA 2</span>.0 p&#229; Mac</a>.  F&#246;ljer man instruktionerna kan man snart testa <span class="caps">CUDA</span> p&#229; sin maskin:</p>

	<p><blockquote><br />
js@stajlis.springfield.se:/Developer/CUDA/bin/darwin/release>./deviceQuery<br />
There is 1 device supporting <span class="caps">CUDA</span></p>

	<p>Device 0: &#8220;GeForce 9400M&#8221;</p>
  Major revision number:                         1
  Minor revision number:                         1
  Total amount of global memory:                 266010624 bytes
  Number of multiprocessors:                     2
  Number of cores:                               16
  Total amount of constant memory:               65536 bytes
  Total amount of shared memory per block:       16384 bytes
  Total number of registers available per block: 8192
  Warp size:                                     32
  Maximum number of threads per block:           512
  Maximum sizes of each dimension of a block:    512&#215;512 x 64
  Maximum sizes of each dimension of a grid:     65535&#215;65535 x 1
  Maximum memory pitch:                          262144 bytes
  Texture alignment:                             256 bytes
  Clock rate:                                    0.80 GHz
  Concurrent copy and execution:                 No<br />
</blockquote>

	<p>16 ber&#228;kningsenheter &#228;r inte precis enormt m&#229;nga, iaf inte i j&#228;mf&#246;relse med <a href="http://en.wikipedia.org/wiki/NVIDIA_Tesla">Nvidias Tesla</a>. N&#229;ja, det g&#229;r dock att k&#246;ra <span class="caps">CUDA</span> utan problem och Nvidias exempelapplikationer uppvisar en tydlig acceleration j&#228;mf&#246;rt med en entr&#229;dars <span class="caps">CPU</span>-implementation. Jag uppt&#228;ckte &#228;ven att en totalt &#246;verspecad <span class="caps">CUDA</span>-applikation (ex nbody-applikationrn med 65535 kroppar att ber&#228;kna) totalt s&#228;nker Mac:en.</p>

	<p>Slumptalsgeneratorn <a href="http://en.wikipedia.org/wiki/Mersenne_twister">Mersenne Twister</a> i <span class="caps">CUDA</span>-variant ger p&#229; min maskin f&#246;ljande prestanda:<br />
<blockquote><br />
js@stajlis.springfield.se:/Developer/CUDA/bin/darwin/release>./MersenneTwister<br />
Using device 0: GeForce 9400M<br />
Initializing data for 24000000 samples&#8230;<br />
Loading <span class="caps">CPU</span> and <span class="caps">GPU</span> twisters configurations&#8230;<br />
Generating random numbers on <span class="caps">GPU</span>&#8230;<br />
Generated samples : 24002560<br />
RandomGPU() time  : 77.352997<br />
Samples per second: 3.102990E+08<br />
Applying Box-Muller transformation on <span class="caps">GPU</span>&#8230;<br />
Transformed samples : 24002560<br />
BoxMullerGPU() time : 35.231998<br />
Samples per second  : 6.812716E+08<br />
Reading back the results&#8230;<br />
Checking <span class="caps">GPU</span> results&#8230;<br />
...generating random numbers on <span class="caps">CPU</span> using reference generator<br />
...applying Box-Muller transformation on <span class="caps">CPU</span><br />
...comparing the results<br />
Max absolute error: 2.264977E-06<br />
L1 norm: 1.783765E-07</p>

	<p></blockquote></p>

	<p>Jag har inte hunnit att hacka n&#229;gra egna <span class="caps">CUDA</span>-program. F&#246;rra &#229;ret testade jag (min vana trogen) att koda str&#246;mkryptot <span class="caps">RC4</span> i <span class="caps">CUDA</span>. Inte speciellt f&#246;rv&#229;nande nog gav det dock ingen prestanda&#246;kning. Det var dock mer ett test av att jag fattat hur man kodar f&#246;r <span class="caps">CUDA</span>. Skall f&#246;rs&#246;ka hinna koda lite <span class="caps">CUDA</span> under v&#229;ren och d&#229; pr&#246;va med mer parallella algoritmer och applikationer.</p>

	<p>Senare i &#229;r kommer (om tidplanen st&#228;mmer) Mac <span class="caps">OS X 10</span>.6 &#8211; Snow Leopard. I och med det borde det &#228;ven finnas <span class="caps">SDK</span> p&#229; Mac f&#246;r att koda f&#246;r <a href="http://en.wikipedia.org/wiki/OpenCL">OpenCL</a>, vilket verkar vara mindre yxigt och primitivt &#228;n <span class="caps">CUDA</span>. &#197;terst&#229;r dock att se om det &#228;r s&#229;, n&#228;r 10.6 v&#228;l dyker upp.</p>

	<p>F&#246;r den som vill testa <span class="caps">CUDA</span> har <a href="http://raymondtay.blogspot.com/">Raymond Tay</a> som postade beskrivningen av installationen &#228;ven postat <a href="http://raymondtay.blogspot.com/2009/02/cuda-resources.html">en bra lista med <span class="caps">CUDA</span>-resurser</a>. Om du testar <span class="caps">CUDA</span> och hackar n&#229;gra sp&#228;nnande algoritmer f&#229;r du v&#228;ldigt g&#228;rna posta kommentarer.</p>

	<p>PS: En sak jag inte gillar med min nya Mac &#228;r att tangenterna skramlar. Speciellt mellanslagstangenten l&#229;ter klonk modell en gammal Apple II. Men annars &#228;r den riktigt <em>stajlish</em>.</p>



 <div class="shr-publisher-636"></div>

<p>No related posts.</p>
<p>Related posts brought to you by <a href='http://mitcho.com/code/yarpp/'>Yet Another Related Posts Plugin</a>.</p>]]></content:encoded>
			<wfw:commentRss>http://www.strombergson.com/kryptoblog/2009/03/16/cuda-pa-mac/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

