<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>JL&#039;s blog &#187; функтор</title>
	<atom:link href="http://john.5070.info/tag/%d1%84%d1%83%d0%bd%d0%ba%d1%82%d0%be%d1%80/feed/" rel="self" type="application/rss+xml" />
	<link>http://john.5070.info</link>
	<description>:-)</description>
	<lastBuildDate>Sun, 06 Dec 2009 17:11:56 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.8</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>… И получился GFS :)</title>
		<link>http://john.5070.info/2009/10/%e2%80%a6-%d0%b8-%d0%bf%d0%be%d0%bb%d1%83%d1%87%d0%b8%d0%bb%d1%81%d1%8f-gfs/</link>
		<comments>http://john.5070.info/2009/10/%e2%80%a6-%d0%b8-%d0%bf%d0%be%d0%bb%d1%83%d1%87%d0%b8%d0%bb%d1%81%d1%8f-gfs/#comments</comments>
		<pubDate>Sat, 24 Oct 2009 06:17:27 +0000</pubDate>
		<dc:creator>John Lepikhin</dc:creator>
				<category><![CDATA[программирование]]></category>
		<category><![CDATA[ayatku]]></category>
		<category><![CDATA[Ocaml]]></category>
		<category><![CDATA[функтор]]></category>

		<guid isPermaLink="false">http://john.5070.info/?p=208</guid>
		<description><![CDATA[Доделал «сырую» реализацию тех самых функторов из предыдущего поста. Умеем хранить элементы размером до  эксабайт. Максимальное количество элементов точно не определено, но примерно равно  и изменением буквально десятка байт кода может быть увеличена до примерно . Правда, при этом увеличивается фактический размер ключей и чуть-чуть падает скорость.
Реализованы функторы: Sized (заодно храним фактический размер [...]]]></description>
			<content:encoded><![CDATA[<p>Доделал «сырую» реализацию тех самых функторов из предыдущего поста. Умеем хранить элементы размером до <img src="http://l.wordpress.com/latex.php?latex=2%5E%7B62%7D%20%3D%204611686018427387904%20%3D%204&#038;bg=FFFFFF&#038;fg=000000&#038;s=0" title="2^{62} = 4611686018427387904 = 4" style="vertical-align:-20%;" class="tex" alt="2^{62} = 4611686018427387904 = 4" /> эксабайт. Максимальное количество элементов точно не определено, но примерно равно <img src="http://l.wordpress.com/latex.php?latex=2%5E%7B200%7D&#038;bg=FFFFFF&#038;fg=000000&#038;s=0" title="2^{200}" style="vertical-align:-20%;" class="tex" alt="2^{200}" /> и изменением буквально десятка байт кода может быть увеличена до примерно <img src="http://l.wordpress.com/latex.php?latex=2%5E%7B450%7D&#038;bg=FFFFFF&#038;fg=000000&#038;s=0" title="2^{450}" style="vertical-align:-20%;" class="tex" alt="2^{450}" />. Правда, при этом увеличивается фактический размер ключей и чуть-чуть падает скорость.</p>
<p>Реализованы функторы: Sized (заодно храним фактический размер записи), Splitted (правильнее было бы назвать Striped), Distributed (записи раскидываются по нескольким нижележащим хранилищам), COW (обеспечение почти полной атомарности для всяких сложных хранилищ, типа Splitted, за счёт copy-on-write).</p>
<p>Каким-то сумасшедшим performance пока похвастаться не могу (около 12000 килобайтных выборок в секунду, в случае использования хранилища FileSystem), реализация всё-таки ещё сырая.</p>
<p>Коллега на работе сказанул: «Google BigTable что ли сделал?». Я подумал, и решил, что нет, это Google FS :)</p>
]]></content:encoded>
			<wfw:commentRss>http://john.5070.info/2009/10/%e2%80%a6-%d0%b8-%d0%bf%d0%be%d0%bb%d1%83%d1%87%d0%b8%d0%bb%d1%81%d1%8f-gfs/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Функционалы против классов</title>
		<link>http://john.5070.info/2009/10/%d1%84%d1%83%d0%bd%d0%ba%d1%86%d0%b8%d0%be%d0%bd%d0%b0%d0%bb%d1%8b-%d0%bf%d1%80%d0%be%d1%82%d0%b8%d0%b2-%d0%ba%d0%bb%d0%b0%d1%81%d1%81%d0%be%d0%b2/</link>
		<comments>http://john.5070.info/2009/10/%d1%84%d1%83%d0%bd%d0%ba%d1%86%d0%b8%d0%be%d0%bd%d0%b0%d0%bb%d1%8b-%d0%bf%d1%80%d0%be%d1%82%d0%b8%d0%b2-%d0%ba%d0%bb%d0%b0%d1%81%d1%81%d0%be%d0%b2/#comments</comments>
		<pubDate>Sun, 18 Oct 2009 16:57:30 +0000</pubDate>
		<dc:creator>John Lepikhin</dc:creator>
				<category><![CDATA[Ocaml]]></category>
		<category><![CDATA[программирование]]></category>
		<category><![CDATA[LWT]]></category>
		<category><![CDATA[функтор]]></category>

		<guid isPermaLink="false">http://john.5070.info/?p=203</guid>
		<description><![CDATA[Товарищ (RedChrom) задал вопрос, что я использую больше при разработке на Окамле. Не особо задумываясь ответил, что фифти-фифти. Потом сделал простой grep на свои исходники, и выяснил, что на 80% всё-таки модули и функторы. Причём, объекты и классы по большей части в очень старых исходниках. Сейчас 100% функторы.
Сейчас развлекаюсь написанием универсального интерфейса к разным хранилищам [...]]]></description>
			<content:encoded><![CDATA[<p>Товарищ (RedChrom) задал вопрос, что я использую больше при разработке на Окамле. Не особо задумываясь ответил, что фифти-фифти. Потом сделал простой grep на свои исходники, и выяснил, что на 80% всё-таки модули и функторы. Причём, объекты и классы по большей части в очень старых исходниках. Сейчас 100% функторы.</p>
<p><span id="more-203"></span>Сейчас развлекаюсь написанием универсального интерфейса к разным хранилищам (в первую очередь, это FS, memcached, memcachedb) с записями вида key+value. В качестве основы, создал универсальный интерфейс:</p>

<div class="wp_syntax"><div class="code"><pre class="ocaml" style="font-family:monospace;"><span style="color: #06c; font-weight: bold;">module</span> <span style="color: #06c; font-weight: bold;">type</span> STORAGE <span style="color: #a52a2a;">=</span>
        <span style="color: #06c; font-weight: bold;">sig</span>
                <span style="color: #06c; font-weight: bold;">type</span> t
                <span style="color: #06c; font-weight: bold;">type</span> storage_descr_t
&nbsp;
                <span style="color: #06c; font-weight: bold;">val</span> init<span style="color: #a52a2a;">:</span> storage_descr_t <span style="color: #a52a2a;">-&gt;</span> t init_result
&nbsp;
                <span style="color: #06c; font-weight: bold;">val</span> get<span style="color: #a52a2a;">:</span> t <span style="color: #a52a2a;">-&gt;</span> Key<span style="color: #a52a2a;">.</span><span style="color: #060;">t</span> <span style="color: #a52a2a;">-&gt;</span> get_result Lwt<span style="color: #a52a2a;">.</span><span style="color: #060;">t</span>
                <span style="color: #06c; font-weight: bold;">val</span> get_list<span style="color: #a52a2a;">:</span> t <span style="color: #a52a2a;">-&gt;</span> Key<span style="color: #a52a2a;">.</span><span style="color: #060;">t</span> list <span style="color: #a52a2a;">-&gt;</span> get_result Lwt<span style="color: #a52a2a;">.</span><span style="color: #060;">t</span> list
&nbsp;
                <span style="color: #06c; font-weight: bold;">val</span> delete<span style="color: #a52a2a;">:</span> t <span style="color: #a52a2a;">-&gt;</span> Key<span style="color: #a52a2a;">.</span><span style="color: #060;">t</span> <span style="color: #a52a2a;">-&gt;</span> delete_result Lwt<span style="color: #a52a2a;">.</span><span style="color: #060;">t</span>
&nbsp;
                <span style="color: #06c; font-weight: bold;">val</span> set<span style="color: #a52a2a;">:</span> t <span style="color: #a52a2a;">-&gt;</span> Key<span style="color: #a52a2a;">.</span><span style="color: #060;">t</span> <span style="color: #a52a2a;">-&gt;</span> ?value_size<span style="color: #a52a2a;">:</span>value_size <span style="color: #a52a2a;">-&gt;</span> value <span style="color: #a52a2a;">-&gt;</span> set_result Lwt<span style="color: #a52a2a;">.</span><span style="color: #060;">t</span>
                <span style="color: #06c; font-weight: bold;">val</span> add<span style="color: #a52a2a;">:</span> t <span style="color: #a52a2a;">-&gt;</span> Key<span style="color: #a52a2a;">.</span><span style="color: #060;">t</span> <span style="color: #a52a2a;">-&gt;</span> ?value_size<span style="color: #a52a2a;">:</span>value_size <span style="color: #a52a2a;">-&gt;</span> value <span style="color: #a52a2a;">-&gt;</span> add_result Lwt<span style="color: #a52a2a;">.</span><span style="color: #060;">t</span>
                <span style="color: #06c; font-weight: bold;">val</span> replace<span style="color: #a52a2a;">:</span> t <span style="color: #a52a2a;">-&gt;</span> Key<span style="color: #a52a2a;">.</span><span style="color: #060;">t</span> <span style="color: #a52a2a;">-&gt;</span> ?value_size<span style="color: #a52a2a;">:</span>value_size <span style="color: #a52a2a;">-&gt;</span> value <span style="color: #a52a2a;">-&gt;</span> replace_result Lwt<span style="color: #a52a2a;">.</span><span style="color: #060;">t</span>
        <span style="color: #06c; font-weight: bold;">end</span></pre></div></div>

<p>Написал модуль FileSystem, реализующий такой интерфейс. Поскольку файлы могут быть (условно) бесконечного размера, это стало самой простой реализацией интерфейса. Но не всё в жизни так легко. Например, memcached имеет максимальный размер пары key+value где-то в районе 64KB. А хочется в нём хранить побольше. Да и файловые системы бывают дурные. Напрмер, не позволяют создавать файлы больше 512MB. Поэтому на основе FileSystem (ключевое слово import) был написан маленький модуль FileSystemSized, который помимо value пишет в файлик размер value. Штука, на первый взгляд, бесполезная. Но идём дальше. Создаём функтор Splitted, который принимает модуль с интерфейсом STORAGE и делает модули с тем же уже знакомым нам интерфейсом STORAGE. Этот функтор хитрый: он знает, какого максимум размера value может хранить переданный ему модуль. Если в одну запись не влазит — он бьёт value на кусочки, для каждого кусочка генерит свой уникальный ключ, и таким образом пишет. В первом кусочке он сохраняет реальный размер всего value. Вот зачем нам нужен был модуль FileSystemSized. На основе этого функтора получается чудесный модуль FileSystemSplitted. По образу и подобию можно сделать MemcachedSplitted. Или даже FileSystemSplitted_and_again_Splitted, только я не придумал зачем :)</p>
<p>Мыслим вперёд. Ключ у нас — строчка строгой длины, с равной вероятностью имеющая в первом/втором/третьем/&#8230; байте любое из значений 0..255. На основе первого байта ключа, мы можем раскидать пары key+value на 256 физических хранилищ (ну, или меньше, как захочется). Назовём такой функтор Distributed, и он тоже будет создавать модули с интерфейсом STORAGE. Получается изумительная картинка:</p>

<div class="wp_syntax"><div class="code"><pre class="ocaml" style="font-family:monospace;"><span style="color: #5d478b; font-style: italic;">(* Создаём уже знакомый нам модуль для хранения больших значений
   в маленьких файлах.
*)</span>
<span style="color: #06c; font-weight: bold;">module</span> FileSystemSplitted <span style="color: #a52a2a;">=</span> Splitted<span style="color: #6c6;">&#40;</span>FileSystemSized<span style="color: #6c6;">&#41;</span>
&nbsp;
<span style="color: #5d478b; font-style: italic;">(* Каждое значение хранится в одном файлике, но файлики раскидываются
   по разным директориям.
*)</span>
<span style="color: #06c; font-weight: bold;">module</span> FileSystemDistributed <span style="color: #a52a2a;">=</span> Distributed<span style="color: #6c6;">&#40;</span>FileSystemSized<span style="color: #6c6;">&#41;</span>
&nbsp;
<span style="color: #5d478b; font-style: italic;">(* Каждое значение пилится на части, части раскидываются по разным директориям.
   С remote mount, получаем хранилище бесконечного размера для почти
   бесконечного количества значений.
*)</span>
<span style="color: #06c; font-weight: bold;">module</span> FileSystemDistributedSplitted <span style="color: #a52a2a;">=</span> Splitted<span style="color: #6c6;">&#40;</span>FileSystemDistributed<span style="color: #6c6;">&#41;</span>
&nbsp;
<span style="color: #5d478b; font-style: italic;">(* Каждое значение хранится в одной директории, но там оно пилится на части.
   Директорий для хранения может быть несколько. Хранилище получается тоже
   бесконечным, но наполняется не так равномерно.
 *)</span>
<span style="color: #06c; font-weight: bold;">module</span> FileSystemSplittedDistributed <span style="color: #a52a2a;">=</span> Distributed<span style="color: #6c6;">&#40;</span>FileSystemSplitted<span style="color: #6c6;">&#41;</span></pre></div></div>

<p>Как видите, с помощью фактически одного интерфейса и двух функторов, получаем невероятное, лютое количество вариантов хранилища. Даже круче, чем в GlusterFS или GNU Hurd. А ведь мысль можно продолжить ещё дальше, дописав функторы Raid0 (писать значение в несколько хранилищ), Clustered (создаётся на основе списка хранилищ, умеющих только читать и списка хранилищ, умеющих изменять), Flock (за счёт некоторого performace degradation, делать exclusive lock на записи)&#8230; чем я и занимаюсь :) Замечу, что всё это в функционально чисто, без side-effects (они есть только на уровне хранилища) и безумно типобезопасно.</p>
]]></content:encoded>
			<wfw:commentRss>http://john.5070.info/2009/10/%d1%84%d1%83%d0%bd%d0%ba%d1%86%d0%b8%d0%be%d0%bd%d0%b0%d0%bb%d1%8b-%d0%bf%d1%80%d0%be%d1%82%d0%b8%d0%b2-%d0%ba%d0%bb%d0%b0%d1%81%d1%81%d0%be%d0%b2/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
	</channel>
</rss>
