2012-08-14 28 views
6

में rdf triples लोडिंग this dump से LinkedGeoData.org का स्थानीय दर्पण बनाने का प्रयास कर रहा हूं।virtuoso opensource

यह लगभग 61,000,000 ट्रिपल है। Virtuoso आसानी से उस से बहुत अधिक संभालना माना जाता है, लेकिन हर बार यह लगभग 40,000,000 ट्रिपल के बाद लोडिंग बंद कर देता है। मैं अमेज़ॅन ईसी 2 से एक डबल अतिरिक्त बड़े उदाहरण का उपयोग कर रहा हूं जिसमें 30 जीबी रैम है, जिसमें बहुत सी स्टोरेज स्पेस भी छोड़ी गई है। क्या मेरी कॉन्फ़िगरेशन फ़ाइल में कुछ गड़बड़ है? मैं उबंटू सर्वर 12.04 का उपयोग कर रहा हूं, और मैंने apt-get (संस्करण 6.1.5) के माध्यम से Virtuoso को स्थापित करने और Jörn Hees' instructions के बाद जिथब (संस्करण 6.1.6) से नवीनतम स्थिर स्रोत से संकलित करने का प्रयास किया है।

मैंने डंपफाइल को छोटे टुकड़ों में विभाजित करने और उन्हें एक-एक करके लोड करने का भी प्रयास किया है। लगभग 40,000,000 ट्रिपल डालने के बाद भी यह टूट जाता है।

लॉगफाइल कुछ भी अजीब नहीं दिखाता है; virtuoso-t वास्तव में क्रैश होने के बिना बस काम करना बंद कर देता है, और top सीपीयू के 0% का उपयोग कर प्रक्रिया दिखाता है। मैंने पहली छमाही घंटे के बाद किसी भी प्रगति के बिना प्रक्रिया को कई दिनों तक चलाना छोड़ दिया है।

[Database] 
DatabaseFile   = /var/lib/virtuoso/db/virtuoso.db 
ErrorLogFile   = /var/lib/virtuoso/db/virtuoso.log 
LockFile   = /var/lib/virtuoso/db/virtuoso.lck 
TransactionFile   = /var/lib/virtuoso/db/virtuoso.trx 
xa_persistent_file  = /var/lib/virtuoso/db/virtuoso.pxa 
ErrorLogLevel   = 7 
FileExtend   = 200 
MaxCheckpointRemap  = 625000 
Striping   = 0 
TempStorage   = TempDatabase 


[TempDatabase] 
DatabaseFile   = /var/lib/virtuoso/db/virtuoso-temp.db 
TransactionFile   = /var/lib/virtuoso/db/virtuoso-temp.trx 
MaxCheckpointRemap  = 2000 
Striping   = 0 


; 
; Server parameters 
; 
[Parameters] 
ServerPort   = 1111 
LiteMode   = 0 
DisableUnixSocket  = 1 
DisableTcpSocket  = 0 
;SSLServerPort   = 2111 
;SSLCertificate   = cert.pem 
;SSLPrivateKey   = pk.pem 
;X509ClientVerify  = 0 
;X509ClientVerifyDepth  = 0 
;X509ClientVerifyCAFile  = ca.pem 
ServerThreads   = 20 
CheckpointInterval  = 60 
O_DIRECT   = 0 
CaseMode   = 2 
MaxStaticCursorRows  = 5000 
CheckpointAuditTrail  = 0 
AllowOSCalls   = 0 
SchedulerInterval  = 10 
DirsAllowed   = ., /usr/share/virtuoso/vad, /home/ubuntu/lgd 
ThreadCleanupInterval  = 0 
ThreadThreshold   = 10 
ResourcesCleanupInterval = 0 
FreeTextBatchSize  = 100000 
SingleCPU   = 0 
VADInstallDir   = /usr/share/virtuoso/vad/ 
PrefixResultNames    = 0 
RdfFreeTextRulesSize  = 100 
IndexTreeMaps   = 256 
MaxMemPoolSize     = 200000000 
PrefixResultNames    = 0 
MacSpotlight     = 0 
IndexTreeMaps     = 64 
;; 
;; When running with large data sets, one should configure the Virtuoso 
;; process to use between 2/3 to 3/5 of free system memory and to stripe 
;; storage on all available disks. 
;; 
;; Uncomment next two lines if there is 2 GB system memory free 
;  NumberOfBuffers   = 170000 
;  MaxDirtyBuffers   = 130000 
;; Uncomment next two lines if there is 4 GB system memory free 
;  NumberOfBuffers   = 340000 
;  MaxDirtyBuffers   = 250000 
;; Uncomment next two lines if there is 8 GB system memory free 
;  NumberOfBuffers   = 680000 
;  MaxDirtyBuffers   = 500000 
;; Uncomment next two lines if there is 16 GB system memory free 
;  NumberOfBuffers   = 1360000 
;  MaxDirtyBuffers   = 1000000 
;; Uncomment next two lines if there is 32 GB system memory free 
     NumberOfBuffers   = 2720000 
     MaxDirtyBuffers   = 2000000 
;; Uncomment next two lines if there is 48 GB system memory free 
;  NumberOfBuffers   = 4000000 
;  MaxDirtyBuffers   = 3000000 
;; Uncomment next two lines if there is 64 GB system memory free 
;  NumberOfBuffers   = 5450000 
;  MaxDirtyBuffers   = 4000000 
;; 
;; Note the default settings will take very little memory 
;; but will not result in very good performance 
;; 


[HTTPServer] 
ServerPort   = 8890 
ServerRoot   = /var/lib/virtuoso/vsp 
ServerThreads   = 20 
DavRoot    = DAV 
EnabledDavVSP   = 0 
HTTPProxyEnabled  = 0 
TempASPXDir   = 0 
DefaultMailServer  = localhost:25 
ServerThreads   = 10 
MaxKeepAlives   = 10 
KeepAliveTimeout  = 10 
MaxCachedProxyConnections = 10 
ProxyConnectionCacheTimeout = 15 
HTTPThreadSize   = 280000 
HttpPrintWarningsInOutput = 0 
Charset    = UTF-8 
;HTTPLogFile    = logs/http.log 

[AutoRepair] 
BadParentLinks   = 0 

[Client] 
SQL_PREFETCH_ROWS  = 100 
SQL_PREFETCH_BYTES  = 16000 
SQL_QUERY_TIMEOUT  = 0 
SQL_TXN_TIMEOUT   = 0 
;SQL_NO_CHAR_C_ESCAPE  = 1 
;SQL_UTF8_EXECS   = 0 
;SQL_NO_SYSTEM_TABLES  = 0 
;SQL_BINARY_TIMESTAMP  = 1 
;SQL_ENCRYPTION_ON_PASSWORD = -1 

[VDB] 
ArrayOptimization  = 0 
NumArrayParameters  = 10 
VDBDisconnectTimeout  = 1000 
KeepConnectionOnFixedThread = 0 

[Replication] 
ServerName   = db-IP-10-252-61-61 
ServerEnable   = 1 
QueueMax   = 50000 


; 
; Striping setup 
; 
; These parameters have only effect when Striping is set to 1 in the 
; [Database] section, in which case the DatabaseFile parameter is ignored. 
; 
; With striping, the database is spawned across multiple segments 
; where each segment can have multiple stripes. 
; 
; Format of the lines below: 
; Segment<number> = <size>, <stripe file name> [, <stripe file name> .. ] 
; 
; <number> must be ordered from 1 up. 
; 
; The <size> is the total size of the segment which is equally divided 
; across all stripes forming the segment. Its specification can be in 
; gigabytes (g), megabytes (m), kilobytes (k) or in database blocks 
; (b, the default) 
; 
; Note that the segment size must be a multiple of the database page size 
; which is currently 8k. Also, the segment size must be divisible by the 
; number of stripe files forming the segment. 
; 
; The example below creates a 200 meg database striped on two segments 
; with two stripes of 50 meg and one of 100 meg. 
; 
; You can always add more segments to the configuration, but once 
; added, do not change the setup. 
; 
[Striping] 
Segment1   = 100M, db-seg1-1.db, db-seg1-2.db 
Segment2   = 100M, db-seg2-1.db 
;... 

;[TempStriping] 
;Segment1   = 100M, db-seg1-1.db, db-seg1-2.db 
;Segment2   = 100M, db-seg2-1.db 
;... 

;[Ucms] 
;UcmPath   = <path> 
;Ucm1    = <file> 
;Ucm2    = <file> 
;... 


[Zero Config] 
ServerName   = virtuoso (IP-10-252-61-61) 
;ServerDSN   = ZDSN 
;SSLServerName   = 
;SSLServerDSN   = 


[Mono] 
;MONO_TRACE   = Off 
;MONO_PATH   = <path_here> 
;MONO_ROOT   = <path_here> 
;MONO_CFG_DIR   = <path_here> 
;virtclr.dll   = 


[URIQA] 
DynamicLocal   = 0 
DefaultHost   = localhost:8890 


[SPARQL] 
;ExternalQuerySource  = 1 
;ExternalXsltSource   = 1 
;DefaultGraph   = http://localhost:8890/dataspace 
;ImmutableGraphs   = http://localhost:8890/dataspace 
ResultSetMaxRows   = 10000 
MaxQueryCostEstimationTime = 4000 ; in seconds 
MaxQueryExecutionTime  = 600 ; in seconds 
DefaultQuery    = select distinct ?Concept where {[] a ?Concept} LIMIT 100 
DeferInferenceRulesInit  = 0 ; controls inference rules loading 
;PingService   = http://rpc.pingthesemanticweb.com/ 
ShortenLongURIs = 1 

[Plugins] 
LoadPath   = /usr/lib/virtuoso/hosting 
Load1    = plain, wikiv 
Load2    = plain, mediawiki 
Load3    = plain, creolewiki 
Load4   = plain, im 

किसी भी मदद की बहुत सराहना की है:

यहाँ मेरी virtuoso.ini फ़ाइल है।

+0

भावी पाठकों के लाभ के लिए ... जोर्न ने अपनी मार्गदर्शिका को कुछ बार अपडेट किया है। [नवीनतम दिनांक 2015-11-23 है, और वर्चुसो 7.2.1 और डीबीपीडिया 2015 पर आधारित है] (https://joernhees.de/blog/2015/11/23/setting-up-a-linked-data-mirror -से-rdf-डंप-dbpedia-2015-04-फ्रीबेस-wikidata-linkedgeodata-साथ-virtuso-7-2-1 और डोकर-वैकल्पिक /)। – TallTed

+0

यह भी ध्यान दें कि वर्चुसो-विशिष्ट प्रश्नों को अक्सर उत्पाद-विशिष्ट संसाधनों जैसे [Virtuoso उपयोगकर्ता मेलिंग सूची] (https://lists.sourceforge.net/lists/listinfo/virtuoso-users/) के माध्यम से अधिक तेज़ी से उत्तर दिया जाता है, जनता [ओपनलिंक समर्थन मंच] (http://boards.openlinksw.com/support/index.php), या एक [गोपनीय ओपनलिंक समर्थन केस] (http://support.openlinksw.com/support/online-support.vsp) । ObDisclaimer: मैं [ओपनलिंक सॉफ्टवेयर] (http://www.openlinksw.com/) के लिए काम करता हूं, [Virtuoso] के निर्माता (http://virtuoso.openlinksw.com/)। – TallTed

उत्तर

4

मेरे अपने प्रश्न का उत्तर दें। समस्या लाइनों

NumberOfBuffers   = 2720000 
    MaxDirtyBuffers   = 2000000 

उन हटाया जा रहा है में अग्रणी रिक्त स्थान थे, गुणी वास्तव में के बजाय उपलब्ध स्मृति डिफ़ॉल्ट 16MB इस्तेमाल किया।