मैं डायरेक्ट कॉम्प्यूट टेक्नोलॉजीज में वास्तव में नया हूं, और एमएसडीएन वेबसाइट पर दस्तावेज से सीखने का प्रयास कर रहा हूं, जो कि कम से कम कहने के लिए घना है।एचएलएसएल बफर स्ट्रिंग और थ्रेडिंग - यहां क्या हो रहा है?
मैं एक मूल एचएलएसएल फ़ाइल बनाना चाहता हूं जो 4x4 मैट्रिक्स और 4xN मैट्रिक्स लेता है और गुणा परिणाम देता है। लेकिन कोड के साथ कुछ समय बिताने के बाद, मुझे कुछ अजीब चीजें मिली हैं जो मुझे समझ में नहीं आती हैं - मुख्य रूप से मैं कैसे थ्रेड्स को पास करता हूं, बफर और आउटपुट डेटा को संसाधित करता हूं।
इन सभी उदाहरणों के साथ, मैं दो 16 फ्लोट बफर में जाता हूं और 16 फ्लोट बफर निकालता हूं और फिर 4x1x1 समूह के साथ डिस्पैच करता हूं - मैं आपको कोड दिखा सकता हूं, लेकिन मैं ईमानदारी से नहीं जानता कि आपको मेरी मदद करने में क्या मदद मिलेगी । मुझे बताएं कि मेरे सी ++ कोड का एक अनुभाग है जिसे आप देखना चाहते हैं।
निम्न कोड के साथ:
StructuredBuffer<float4x4> base_matrix : register(t0); // byteWidth = 64
StructuredBuffer<float4> extended_matrix : register(t1); // byteWidth = 64
RWStructuredBuffer<float4> BufferOut : register(u0); // byteWidth = 64, zeroed out before reading from the GPU
[numthreads(1, 1, 1)]
void CSMain(uint3 DTid : SV_DispatchThreadID)
{
BufferOut[DTid.x].x = 1;
}
मैं निम्न मान बाहर निकलना:
1.000 0.000 0.000 0.000
1.000 0.000 0.000 0.000
1.000 0.000 0.000 0.000
1.000 0.000 0.000 0.000
यह मेरे लिए समझ में आता है - बफर 4 धागे के रूप में पार्स किया गया है, जिनमें से प्रत्येक को क्रियान्वित 1 Float4 समूह।
1.000 1.000 1.000 1.000
1.000 1.000 1.000 1.000
1.000 1.000 1.000 1.000
1.000 1.000 1.000 1.000
और वास्तविक कोड के साथ मैं चलाना चाहते हैं:
StructuredBuffer<float4x4> base_matrix : register(t0);
StructuredBuffer<float4> extended_matrix : register(t1);
RWStructuredBuffer<float4> BufferOut : register(u0);
[numthreads(1, 1, 1)]
void CSMain(uint3 DTid : SV_DispatchThreadID)
{
BufferOut[DTid.x] = mul(base_matrix[0],extended_matrix[DTid.x])
}
मैं
StructuredBuffer<float4x4> base_matrix : register(t0); // byteWidth = 64
StructuredBuffer<float4> extended_matrix : register(t1); // byteWidth = 64
RWStructuredBuffer<float4> BufferOut : register(u0); // byteWidth = 64, zeroed out before reading from the GPU
[numthreads(1, 1, 1)]
void CSMain(uint3 DTid : SV_DispatchThreadID)
{
BufferOut[DTid.x].x = 1;
BufferOut[DTid.x].y = 2;
BufferOut[DTid.x].z = 3;
BufferOut[DTid.x].w = 4;
}
मैं निम्न मान बाहर निकलना:
निम्न कोड के साथनिम्नलिखित मान बाहर:
0.000 0.000 0.000 0.000
0.000 0.000 0.000 0.000
0.000 0.000 0.000 0.000
0.000 0.000 0.000 0.000
मैं बता सकता हूं कि मुझे यहां एक महत्वपूर्ण बात याद आ रही है, लेकिन मेरे जीवन के लिए मुझे उचित दस्तावेज नहीं मिल रहा है कि यह कैसे काम करता है। क्या कोई मुझे इस कोड में क्या चल रहा है समझने में मदद कर सकता है?
अपने समय के लिए धन्यवाद,
ज़ैक
एक और नोट के रूप में, इस कोड को एक साथ cribbed था माइक्रोसॉफ्ट डायरेक्ट एसडीके (जून 2010) \ नमूने \ सी ++ \ Direct3D11 \ BasicCompute11 नमूना उपलब्ध का उपयोग कर। अगर मैं कुछ गलत कर रहा हूं, तो मुझे बताने में संकोच न करें। मैं एचएलएसएल में वास्तव में नया हूँ।
संपादित करें: मेरा बफर निर्माण कोड।
CreateStructuredBuffer(g_pDevice, sizeof(float)*16, 1, g_matrix, &g_pBuf0);
CreateStructuredBuffer(g_pDevice, sizeof(float)*4, NUM_ELEMENTS, g_extended_matrix, &g_pBuf1);
CreateStructuredBuffer(g_pDevice, sizeof(float)*4, NUM_ELEMENTS, NULL, &g_pBufResult);
//--------------------------------------------------------------------------------------
// Create Structured Buffer
//--------------------------------------------------------------------------------------
HRESULT CreateStructuredBuffer(ID3D11Device* pDevice, UINT uElementSize, UINT uCount, VOID* pInitData, ID3D11Buffer** ppBufOut)
{
*ppBufOut = NULL;
D3D11_BUFFER_DESC desc;
ZeroMemory(&desc, sizeof(desc));
desc.BindFlags = D3D11_BIND_UNORDERED_ACCESS | D3D11_BIND_SHADER_RESOURCE;
desc.ByteWidth = uElementSize * uCount;
desc.MiscFlags = D3D11_RESOURCE_MISC_BUFFER_STRUCTURED;
desc.StructureByteStride = uElementSize;
if (pInitData)
{
D3D11_SUBRESOURCE_DATA InitData;
InitData.pSysMem = pInitData;
return pDevice->CreateBuffer(&desc, &InitData, ppBufOut);
} else
return pDevice->CreateBuffer(&desc, NULL, ppBufOut);
}
कोशिश कर रहा .1, .2, .3, .4 ...
StructuredBuffer<float4x4> base_matrix : register(t0);
StructuredBuffer<float4> extended_matrix : register(t1);
StructuredBuffer<uint> loop_multiplier : register(t2);
RWStructuredBuffer<float4> BufferOut : register(u0);
[numthreads(1, 1, 1)]
void CSMain(uint3 DTid : SV_DispatchThreadID)
{
BufferOut[DTid.x].x = .1;
BufferOut[DTid.x].y = .2;
BufferOut[DTid.x].z = .3;
BufferOut[DTid.x].w = .4;
}
इस बाहर हो गया:
0.100 0.100 0.100 0.100
0.100 0.100 0.100 0.100
0.100 0.100 0.100 0.100
0.100 0.100 0.100 0.100
आप कोड जहां आप अपने ID3D11Buffers और उन्हें बनाने के लिए इस्तेमाल विभिन्न * _DESC वस्तुओं की सामग्री सहित इसी ID3D11ShaderResourceView और ID3D11UnorderedAccessView वस्तुओं, बनाने के पोस्ट कर सकते हैं? इसके अलावा, यादृच्छिक हंच: क्या आप दूसरे उदाहरण में 1,2,3,4 के बजाय 0.1, 0.2, 0.3, 0.4 लिखने का प्रयास कर सकते हैं? – postgoodism
मैं इसे सुबह में पोस्ट करूंगा (ईटा 8 घंटे)। बाद में इसे पकड़ नहीं लिया। लेकिन अग्रिम धन्यवाद! –
@ पोस्टस्टूडिज्म: मेरा बफर निर्माण कोड जोड़ा गया। आपको किसी और चीज़ की ज़रुरत हो तो मुझे बताएं। –